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(57) Das erfindungsgemaBe Hepatitis C Virus 
(HCV) Zeilkultursystem besteht aus humanen Hepato- 
mazellen, die mit einem HCV-RNA-Konstrukt transfi- 
ziert sind, das die HCV-spezifischen RNA-Abschn'rtte 5" 
MTR, NS3, NS4A, NS4B, NS5A, NS5B und 3' NTR und 
zudem wenigstens ein selektierbares Markergen 
(Selektionsgen) umfaBt. 
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Beschrelbung 

[0001 ] Die Erf indung betrifft ein Hepatitis C Virus (HCV) Zellkultursystem, das im wesentlichen eukaryontische Zel- 
len umfaBt, die eingeschleustes HCV-spezifisches Genmaterial enthalten, d.h. die mit HCV-spezifischem Genmaterial 
5 transfiziert sind. 

[0002] Das Hepatitis C Virus (HCV) ist eine der Hauptursachen chronischer und sporadischer Leberkrankungen 
weltwert. Die meisten HCV-lnfektionen verlaufen ohne erkennbare Winische Symptome, allerdings werden 80-90% der 
Infizierten dauerhafte Virustrftger und bei 50% dieser dauerhaften VirustrSger kommt es zu einer chronischen Leber- 
entzundung mit unterschiedlichen Schweregraden. Ca. 20% der chronisch Infizierten entwickeln im Laufe von 1 0 bis 20 

10 Jahren eine Leberzirrhose, auf deren Basis sich ein prim&res Leberzellkarzinom entwickeln kann. Die chronische 
Hepatitis C ist heute die Hauptindikation fur eine Lebertransplantation. Eine Kausaltherapie gibt es bisher noch nicht. 
Die einzige derzeit verfQgbare Therapie ist die hochdosierte Verabreichung von Interferon-Alpha oder eine Kombination 
aus Interferon-Alpha und dem Purin-NuWeosidanalogon Ribavirin. Allerdings sprechen nur ca. 60 % alter Behandelten 
auf diese Therapie an und bei diesen kommt es in mehr als der Haifte aller Faile nach dem Absetzen der Behandlung 

is zu einer erneuten Viramie. 

Aufgrund der hohen Pravalenz, gerade auch in den Industrieiandern, den schwerwiegenden Folgen chronischer Infek- 
tionen und dem Fehlen einer Kausaltherapie ist die EntwicWung einer HCV-spezifischen Chemotherapie ein wesentli- 
ches 2el der pharmazeutischen Forschung und EntwicWung. Hauptproblem hierbei ist bisher das Fehlen eines 
geeigneten Zellkultursystems, das ein Studium der Virus-Replikation und der Pathogenese in eukaryontischen Zellen 

20 ermOglicht. 

[0003] Aufgrund der geringen Virusmengen im Blut bzw. Gewebe, dem Fehlen geeigneter Zellkultursysteme oder 
Tiermodelle (bis heute ist der Schimpanse das einzige mOgliche Versuchstier) sowie dem Fehlen effizienter Systeme 
zur Produktion virus-ahnlicher Partikel, konnte die molekulare Zusammensetzung des HCV-Partikels bis heute noch 
nicht eingehend untersucht bzw. aufgeWart werden. Die derzeit vorliegenden Ergebnisse lassen sich wie folgt zusam- 

25 menfassen: Das HCV ist ein umhulltes Plusstrang RNA Virus mit einem Partikeldurchmesser von 50-60 nm und einer 
mittleren Dichte von 1,03-1.1g/ml. Es wurde erstmals 1989 molekular Woniert und charakterisiert (Choo et al.. 1989: 
Science, 244, 359-362). Die HCV- RNA hat eine Lflnge von ca. 9.6 kb (= 9600 NuWeotide), eine positive Polaritat und 
bestet ein einziges offenes Leseraster (ORF = open reading frame), das ein lineares Polyprotein von ca 3010 Amino- 
s&uren kodiert (siehe Rice 1996, in Virology, B. N. Fields, D. M. Knipe, P. M. Howley, Eds. (Uppincott-Raven, Philadel- 

30 phia, PA, 1996), vol. 1, pp.931-960; Clarke 1997, J. Gen. Virol. 78, 2397; und Bartenschlager 1997, Intervirology 40, 
378 und vgl. Fig. 1 A). Bei der Virusreplikation wird das Polyprotein durch zelluiare und virale Proteasen in die reifen 
und funktionell aktiven Proteine gespalten. 

Innerhalb des Polyproteins sind die Proteine wie folgt angeordnet (vom Amino- zum Carboxyterminus): Core-E1 -E2-p7- 
NS2-NS3-NS4A-NS4B-NS5A-NS5B. Das Core-Protein ist die Hauptkomponente des NuWeokapsids. Die Glykoprote- 

35 ine E1 und E2 sind Transmembranproteine und Hauptkomponenten der VirushGIIe. Sie spielen wahrscheinlich bei der 
Anhettung des Virus an die Wirtszelle eine wesentliche Rolle. Diese drei Proteine Core, E1 und E2 bauen den Virus- 
partikel auf und werden deshalb als Strukturproteine bezeichnet. Die Funktion des Proteins p7 ist noch unWar. Das Pro- 
tein NS2 ist wahrscheinlich die katalytische Domane der NS2-3 Protease, die fOr die Prozesierung zwischen den 
Proteinen NS2 und NS3 verantwortlich ist. Das Protein NS3 hat zwei Funktionen, namlich in der aminoterminalen 

40 Domane eine Proteaseaktivitat, die fur die Polyproteinprozessierung essentiell ist, und in der carboxyterminalen 
Domane eine NTPase/Helikase-Funktion, die wahrscheinlich bei der Replikation der viralen RNA eine Rolle spielt. Das 
Protein NS4A ist ein KofeWor der NS3-Protease. Die Funktion des Proteins NS4B ist unbekannt. 
[0004] Das offene Leseraster ist an seinem 5* Ende von einer ca 340 NuWeotide langen nicht-translatierten Region 
(NTR = non-translated region) flan Wert, die als interne Ribosomenansatzstelle (IRES = internal ribosome entry site) 

45 fungiert, und an seinem 3' Ende von einer ca. 230 NuWeotide langen NTR, die hOchstwahrscheinlich fur die Genomre- 
plikation von Bedeutung ist. Eine solche 3' NTR ist Gegenstand der Patentanmeldung PCTAJS 96/14033. Die Struktur- 
proteine in dem amino-terminalen Viertel des Polyproteins werden von der Signalpeptidase der Wirtszelle gespalten. 
Die Nicht-Strukturproteine (NS) 2 bis (NS) 5B werden von zwei viralen Enzymen prozessiert, namlich von der NS2-3 
und der NS3/4A Proteinase. Die NS3/4A Proteinase wird for alle Spaltungen jenseits des Carboxyterminus von NS3 

so benotigt Die Rolle von NS4B ist nicht bekannt. NS5A, ein noch phosphoryliertes Protein, scheint fur die Interferon 
Resistenz verschiedener HCV-Genotypen verantwortlich zu sein (vgl. Enomoto et al. 1995, J. Clin. Invest 96, 224; 
Enomoto et al. 1996, N. Engl. J. Med. 334, 77; Gale Jr. et al. 1997, Virology 230, 217; Kaneko et al. 1994, Biochem. 
Biophys. Res. Commun. 205, 320; Reed et al., 1997, J. Virol. 71, 7187) und NS5B wurde als die RNA-abhangige RNA 
Polymerase identifiziert. 

55 [0005] Anhand dieser Erkenntnisse wurden erste Diagnosesysteme entwickelt, die entweder auf dem Nachweis 
von HCV-spezifischen Antikdrpern in Patientenserum oder auf dem Nachweis von HCV-spezif ischer RNA mittels RT- 
PCR (= Reverse Transcription Polymerase Chain Reaction) beruhen, und die mittlerweile routine- und/oder vorschrifts- 
maBig bei alien Blutkonserven angewendet werden (mOssen). 
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[0006] Sert der Erstbeschreibung des Genoms 1 989 wurden mil Hilfe der PC R-Methode zahlreiche Tell- und Kom- 
plettsequenzen des HCV Honiert und charakteriaert Ein Vergleich dieser Sequenzen zeigt eine hone Variability des 
viral en Genoms, insbesondere im Bereich des NS5B-Gens, was letztendDch zu einer Bnteilung in 6 Genotypen gefOhrt 
hat die selbst nochmals in Subtypen a, b. und c untergiiedert sind. Die genomische Varianz tst nicht gleichmaBig uber 
5 das Genom verteitt So sind die 5'NTR und Teile der 3'NTR hoch konserviert. wahrend bestimmte kodierende Sequen- 
zen z.T. sehr stark variieren, vor allem die HQIIproteine E1 und E2. 

[0007] Die Wonierten und charakterisierten Teil- und Kbmpiettsequenzen des HCV-Genoms wurden auBerdem hin- 
sichHich geeigneter Angriffsziele fur ein prospektives antiviral es Therapeutikum urrtersucht. Dabei wurden drei virale 
Enzyme gefunden, die sich als seiches Angriffsziel anbieten. Diese sind (1) der NS3/4A Proteasekomplex, (2) die NS3 

10 Helikase und (3) die NS5B RNA-abhangige RNA Polymerase. Der NS3/4A Proteasekomplex und die NS3 Helikase 
konnten bererts kristallisiert und hinsichtlich ihrer dreidimensionalen Struktur aufgeWart werden (Kim et al.. 1 996, Cell, 
87,343; Yem et al., 1998, Protein Science, 7, 837; Love et al., 1996, Cell, 87, 31 1 ; Kim et al., 1998, Structure, 6, 89; >ao 
et al., 1997, Nature Structural Biology. 4, 463. Cho et al.„ 1998, J. Biol. Chem., 273, 15045); bei der NS5B RNA-abhan- 
gigen RNA Polymerase ist dies bis heute noch nicht gelungen. 

is Obwohl mit cfiesen Enzymen bedeutsame Angriffsziele fur eine TherapieentwicWung der chronischen HCV-lnfektion 
definiert sind, und obwohl sowoh) mit Hilfe von 'rational drug design* als auch mit Hilfe von 'high throughput screens' 
weftweit intensiv nach geeigneten Inhibitoren gesucht wird, leidet die TherapieentwicWung an einem groBen Defizit, 
namlich dem Fehlen von Zellkultursystemen oder einfachen Tiermodellen, die es erlauben, HCV-RNA oder HCV-Anti- 
gene direkt, zuveriassig und mit einfachen laborOblichen Methoden nachzuweisen. Das Fehlen solcher Zellkuttursy- 

20 steme ist auch der Hauptgrund dafur, daB das Verstandnis der HCV-Replikation bis heute noch sehr luckenhaft und in 
weiten Teilen nur hypothetisch ist 

[0008] Obwohl nach Meinung der Fachweft eine enge evolutionare Beziehung zwischen HCV und den Ravi- und 
Pestiviren besteht und fQr diese autonom replizierende RNAs beschrieben sind, die in verschiedenen Zellinien ohne 
weiteres zur Replikation gebracht werden kOnnen und dabei relativ hohe Ausbeuten zeigen ( siehe Khromykh et al., 
25 1 997, J. Virol 71 , 1 497; Behrens et al., 1 998, J. Virol. 72, 2364; Moser et al., 1998, J. Virol 72, 531 8), waren ahnliche 
Versuche mit HCV bisher nicht erfolgreich. 

[0009] Zwar ist aus verschiedenen Publikationen bekannt, daB Zellinien oder primare Zeilkurturen mit HCV-harti- 
gem, hochtitrigem Patientenseaim infiziert werden kBnnen, (Lartford etal. 1994, Virology 202, 606; Shimizuetal. 1993, 
Procedings of the National Academy of Sciences, USA, 90, 6037-6041 ; Mizutani et al. 1996, Journal of Virology, 70, 

30 721 9-7223; M. Ikeda et al. 1 998, Virus Res. 56, 157; Fdurnier et al. 1 998, J. Gen. Virol. 79, 2376 und darin zitierte Lite- 
raturstellen, tto et al. 1996, Journal of General Virology, 77, 1043-1054), diese virusinfizierten Zellinien Oder Zeilkurtu- 
ren erlauben jedoch nicht den direkten Nachweis von HCV-RNA oder HCV-Antigenen. Die virale RNA in diesen Zellen 
ist weder in einem Nothern-Blot (einem Standardverfahren zum quantitative Nachweis von RNA) noch sind die viralen 
Protein in einem Western-Blot Oder mittels Immunprazipitation detektierbar. Nur mit sehr aufwendigen und indirekten 

35 Methoden ist es uberhaupt gelungen, eine HCV-Replikation nachzuweisen. Diese nachteiligen Umstande zeigen War, 
daB die Replikation in diesen bekannten virusinfizierten Zellinien oder Zellkulturen absolut unzureichend ist. 
[001 0] Deswerteren ist aus den Publikationen von Yoo et al. (1 995, Journal of Virology, 69, 32-38) und von Dash et 
al., (1997, American Journal of Pathology, 151 , 363-373) bekannt, daB Hepatomazeilinien mit synthetischer HCV-RNA, 
die mittels in vitro Trankription von Woniertem HCV-Genom gewonnen wurde, transfiziert werden kOnnen. In beiden 

40 Publikationen gingen die Autoren von dem Grundgedanken aus, daB das virale HCV-Genom eine Plusstrang-RNA ist, 
die nach dem Einschleusen in die Zelle direkt als mRNA fungiert an die sich Ribosomen anheften und im Zuge von 
Translationsprozessen Virusproteine bilden, aus denen sich letztendlich neue HCV-Partikel bilden (kOnnen). Diese 
Virusreplikation, d.h. diese neu gebildeten HCV-Viren bzw. deren RNA wurde mittels RT-PCR nachgewiesen. Die publi- 
zierten Ergebnisse der durchgefuhrten RT-PCR sprechen jedoch dafur, daB die Effizienz der HCV-Replikation in den 

45 beschriebenen HCV-transfizierten Hepatomazellen nur sehr gering ist und jedenfalls nicht ausreicht. urn Schwankun- 
gen in der Replikationsrate nach gezielter Einwirkung mit prospektiven antiviralen Therapeutika auch nur qualrtativ, 
geschweige denn quantitativ zu messen. AuBerdem ist im Stand der Technik mhtlerweile bekannt (Yanagi et al., Proc. 
Natl. Acad. Sci. USA, 96, 2291 -95, 1999), daB die hochkonservierte 3' NTR essentiell ist fOr die Virusreplikation, was 
in Warem Widerspruch zu den Behauptungen von Yoo et al. und Dash et al. stent, die fur ihre Versuche in Unkenntnis 

so des autherrtischen 3* Endes des HCV-Genoms ausschlieBlich HCV-Genome mit verkQrzten 3' NTRs verwendet haben. 
[001 1 ] Aufgabe der vorliegenden Erf indung ist die Berertstellung eines HCV- Zellkultursystems, bei dem die virale 
RNA in den transf izierten Zellen autonom und mit so hoher Effizienz repliziert daB Schwankungen in der Replikations- 
rate nach gezielter Einwirkung mit virus- und insbesondere HCV-spez'rfischen prospektiven antiviralen Therapeutika 
qualrtativ und quantitativ und mit HiHe gangiger, laborOblicher MeBverfahren gemessen werden kOnnen. 

55 [0012] Eine LOsung dieser Aufgabe besteht in der Berertstellung eines Zellkultursystems der eingangs genannten 
Art, bei dem die eukaryorrtischen Zellen humane Zellen, insbesondere Hepatomazellen sind, die vorzugsweise von 
einer handelsQblichen Hepatomazellinie abstammen, aber auch aus einer entsprechenden Primarzellkuftur gewonnen 
sein kOnnen, und bei dem das eingeschleuste HCV-spezifische Genmaterial ein HCV-RNA-Konstrukt ist, das im 
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wesentlichen die HCV-spezifischen RNA-Abschnitte 5* NTR, NS3, NS4A, NS4B, NS5A, NS5B und 3' NTR, vorzugs- 
weise in der genannten Reihenfolge, und zudem wenigstens ein selektierbares Markergen (SeleWionsgen) umfaBt 
"NTR" stent hier und im folgenden fur "nicht-translatierte Region" und ist dem einschiagigen Fachmann als Begriff bzw. 
AbkQrzung bekannt und geiaufig. Der Begriff "HCV-RNA-KonstrukT umfaBt hier und im folgenden sowohl Konstrukte, 
5 die das komplette HCV-Genom enthalten, als auch solche, die lediglich einen Teil davon, d.h. ein HCV-Subgenom ent- 
halten. 

Eine bevorzugte Variante des erfindungsgemaBen Zellkurtursystems, die sich in der Praxis sehr gut bewahrt hat, ist 
unter der Nummer DSM ACC2394 (Laborbezeichnung HuBI 9-13) bei der DSMZ, Deutsche Sammlung von Mikroorga- 
nismen und Zellkuituren GmbH in Braunschweig, Deutschland, hinterlegt 

10 [001 3] Mit dem erfindungsgemaBen Zellkurtursystem wird erstmals ein in-vitro-System bereit gestelrt, in dem HCV- 
RNA intrazelluiar, autonom und in ausreichend groBen Mengen repliziert und exprimiert wird, so daB eine quantitative 
Bestimmung sowohl der HCV-RNA-Mengen als auch der HCV-spezifischen Proteine mit konventionellen und zuverias- 
sig genauen biochemischen MeBmethoden durchgefuhrt werden kann. Das heiBt: es stent erstmals ein annahernd 
authentisches zellgestutztes ("cell-based") HCV-Replikationssystem zur Verf ugung, das fQr die EntwicWung und Erpro- 

is bung von antiviralen Pharmazeutika dringend benOtigt wird. Dieses Testsystem bietet nun die MOglichkeit, potentielle 
Angriffsziele f Or eine wirksame HCV-spezifische Therapie zu identifizieren und HCV-spezifische Chemotherapeutika zu 
entwickeln und zu evaluieren. 

[0014] Die Erfindung basiert auf der uberraschenden Erkenntnis, daB eine effiziente Replikation der HCV-RNA nur 
dann in Zellen stattfindet, wenn diese mit einem HCV-RNA-Konstrukt transfiziert wurden, das mindestens die 5' und die 

20 3' nicht-translatierten Regionen (NTR) und die Nichtstrukturproteine (NS) 3 bis 5B umfaBt und zusatzlich ein selektier- 
bares Markergen (Selektionsgen) aufweist Offensichtlich sind die Strukturgene fOr den Ablauf der Replikation ohne 
wesentliche Bedeutung, wahrend andererseits eine effiziente Replikation der HCV-RNA anscheinend nur dann stattfin- 
det, wenn die transfizierten Zellen einem permanenten Selektionsdruck unterzogen werden, der durch das mit der 
HCV-RNA verbundene selektierbare Markergen (Selektionsgen) vermittelt wird. Das Markergen (Selektionsgen) 

25 scheint somit einerseits die Selektion derjenigen Zellen zu provozieren, in denen die HCV-RNA produkr/rv repliziert, und 
andererseits scheint es die Effizienz der RN A-Replikation wesentlich zu steigern. 

[0015] Gegenstand der Erfindung ist auch ein zellfreies HCV-RNA-Kbnstrukt, das sich dadurch auszeichnet, daB 
es die HCV-spezifischen RNA-Abschnitte 5* NTR, NS3, NS4A, NS4B, NS5A, NS5B und 3' NTR, vorzugsweise in der 
genannten Reihenfolge, und zudem ein selektierbares Markergen (Selektionsgen) umfaBt 
30 [0016] Der Begriff 5' NTR bzw. NS3 bzw. NS4A bzw. NS4B bzw. NS5A bzw. NS5B bzw. 3* NTR umfaBt im vorlie- 
genden Zusammenhang jede NuWeotidsequenz, die im Stand der Technik als NuWeotidsequenz fQr den jeweils betref- 
fenden funktionellen Abschnitt des HCV-Genpms beschrieben ist 

[0017] Die Bereitstellung eines solchen HCV-RNA-Konstrukts ermOglicht erstmals eine detaillierte Analyse der 
HCV - Replikation, - Pathogenesis und - Evolution in Zellkuituren. Die HCV-spezifische virale RNA kann - als vollstan- 
35 diges Genom oder als Subgenom - gezieft in beliebigen Mengen erzeugt werden, und es besteht die MOglichke'rt, das 
RNA-Konstrukt zu manipulieren und damit die HCV-Funktionen auf genetischer Ebene zu untersuchen und aufzukia- 
ren. 

[0018] Da alls zur Zeit als Hauptangriffsziel fQr eine Therapie untersuchten HCV-Enzyme, namlich die NS3/4A Pro- 
tease, die NS3 Helikase und die NS5B Polymerase, in dem erf indungsgemaBen HCV-RNA-Kbnstrukt enthalten sind, 

40 kann es fOr alle entsprechenden Untersuchungen benutzt werden. 

[0019] Eine AusfQhrungsform des HCV-RNA-Kbnstrukts, die sich in der praktischen Anwendung sehr gut bewahrt 
hat, zeichnet sich dadurch aus, daB sie die NuWeotidsequenz gemaB Sequenzprotokoll SEQ ID NO:1 umfaBt 
Weitere Ausfuhrungsvarianten mit vergleichbar guten Eigenschaften fQr den Einsatz in der Praxis sind dadurch 
gekennzeichnet, daB sie eine NuWeotidsequenz ehtweder gemaB Sequenzprotokoll SEQ ID NO:2 oder SEQ ID NO:3 

45 oder SEQ ID NO:4 oder SEQ ID NO:5 oder SEQ ID NO:6 oder SEQ ID NO:7 oder SEQ ID NO:8 oder SEQ ID NO:9 
oder SEQ ID NO:10 oder SEQ ID NO:1 1 umfassen. 

[0020] Es besteht die MOglichkeit, das erf indungsgemaBe HCV-Subgenom-Kbnstrukt mit einer 3' NTR zu verse- 
hen, die eine im Stand der Technik hierfur bisher unbekannte NuWeotidsequenz aufweist, namlich eine NuWeotidse- 
quenz, die aus der Gruppe der nachfolgend aufgelisteten NuWeotidsequenzen (a) bis (0 ausgewahft ist: 

50 
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(a) ACGGGGAGCTAAACACTCCAGGCCAATAGGCCATCCTGTTTTTTTTTTTA 
GCTTTTI 11 11 11 T C TI 11 1 IT riG AGAGAGAGAGTCTCACTCTGTTGCCC 
AGACTGGAGT 

(b) ACGGGGAGCTAAACACTCCAGGCCAATAGGCCArcCTGTTTTTT 
TTTTTAGTCT TTTTTTTTTC TTTTTTTTGA GAGAGAGAGT CTCACTCTGT 
TGCCCAGACT GGAGC 

(c) ACGGGGAGCTAAACACTCCAGGCCAATAGGCCATCCTGTTTTTT 
TTTAATCTTT TTTTTTTTCT TTTTTTTTGA GAGAGAGAGT CTCACTCTGT 
TGCCCAGACT GCAGC 

(d) ACGGGGAGCTAAACACTCCAGGCCAATAGGCCATCCTGTTTTTT 
TTTTTTAGTC TTTTTTTTI 1 TCTTTTTTTT TGAGAGAGAG AGTCTCACTC 
TGTTGCCCAG ACTGGAGT 



(e) ACGGGGAGCTAAACACTCCAGGCCAATAGGCCATCCTGTTTTTT 
TTTTTAGTCT TTTTTTTTTT TCTTTTTTTT TGAGAGAGAG AGTCTCACTC 
TGTTGCCCAG ACTGGAGT 

(f) ACGGGGAGK^TAAACACT<XAGGCCAATAGGCCATCCTGTTTTTT 
TTTTTAGTCT TTTTTTTTTT TCTTTTTTTT TTGAGAGAGA GAGTCTCACT 
CTGTTGCCCA GACTGGAGT 

(g) ACGGGGAGCTAAACACTCCACH3CCAATACKK:CATCCTGTTTTTT 
TTTTTAGTCT TTTTTTTTTT CTTTTTTTTT GAGAGAGAGA 
GTCTCACTCT GTTGCCCAGA CTGGAGT 

(h) ACGGGGAGCTAAACACTCCAGGCCAATAGGCCATCCTGTTTTTT 
TTTTTTTAAT CTTTTTTTTT TTTTTCCTTT TTTTGAGAGA 
GAGAGTCTCA CTCTGTTGCC CAGACTGGAG T 

(i) ACGGGGAGCTAAACACTCCAGGCCAATAG<XCATCCTGTTTTTT 
TTTTTTAATC TTTTTTTTTT TTTTCTTTTT TTTTTGAGAG 
AGAGAGTCTC ACTCTGTTGC CCAGACTGGA GT 

Das in den erfindungsgemaBen HCV-RNA-Konstrukten enthaltene selektierbare Markergen (Seiektionsgen) ist vor- 
zugsweise ein Resistenzgen, insbesondere eine Arrtibiotikumresistenzgen. 

Das hat den Vorta'l. daB die mit diesem KonstruW transfizierten Zellen leicht von den nicht transfizierten Zellen selek- 
tiert werden konnen, indem dem Zellkulturmedium z.B. im Fall eines Antibiotikumresistenzgens das betreffende Anti- 
biotikum zugegeben wird. Unter Antibiotikiim' wird im vorliegenden Zusammenhang jede Substanz verstanden, die die 
nicht-transfizierten Wirtszellen Oder die Zellen, in denen die HCV-RNA nur mit geringer Effizienz repliziert am Leben 
oder Wachstum hindert, insbesondere Zetlgrfte wie z.B. Puromycin, Hygromycin. Zeocin, Bleomycin oder Blasticidin. 
[0021 ] Ein bevorzugtes selektierbares Markergen (Seiektionsgen) bzw. Resistenzgen, das sich in der Praxis sehr 
gut bewahrt hat, ist das Neomycinphosphotransferasegen. 

[0022] Eine Alternative zu den Antittofikumresistenzgenen ist z.B. das Thymidin-Kinase-Gen, mit dem eine HAT- 
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Selektion durchgefuhrt werden kann. 

[0023] Die Position des selektierbaren Markergens (Selektionsgens). bzw. des bevorzugten Resistenzgens bzw. 
des besonders bevorzugten Antibiotikumresistenzgens in dem HCV-RNA-Konstrukt liegt vorzugsweise hinter der HCV 
5* NTR, d.h. strangabwarts der 5' NTR bzw. strangaufwarts des HCV-Leserasters. Denkbar ist aber auch eine Insertion 
im Bereich der 3' NTR Oder an anderer Stelle des HCV-Genoms Oder -Subgenoms, z.B. innerhalb des Polyproteins. 
[0024] Bei einer arternativen AusfOhrungsform des erfindungsgemaBen HCV-RNA-Konstrukts ist das selektierbare 
Markergen (Selektionsgen), insbesondere ein Antibiotikumresistenzgen, uber ein Ribozym bzw. eine Erkennungsstelle 
fur ein Ribozym mitder HCV-RNAbzw. der HCV-Genom- oder -Subgenomsequenz verbunden. 
[0025] DanYrt gent der Vorteil einher, daB nach erfolgter Selektion derjenigen Zellen, in denen die HCV-RNA pro- 
duktiv repliziert. in den daraus gewonnenen ZellWonen das Resistenzgen durch ribozymvermittelte Spaltung von der 
HCV-Subgenomsequenz abgetrennt werden kann, namlich durch Aktivierung des einWonierten Ribozyms Oder, im Fall 
eines Konstrukts mit einer Erkennungsstelle fur ein Ribozym, durch Einschleusen des Ribozyms in die Zellen (z.B. mit- 
tels Transfektion eines Ribozymkonstrukts oder Infektion mit einem viralen Expressionsvektor, in den das entspre- 
chende Ribozym eingesetzt wurde). Auf diese Weise wird ein authentisches HCV-Genom-Kbnstrukt ohne 
Resistenzgen erhatten, das zur Bildung authentischer infektiteer Viruspartikel befahigt ist. 

[0026] Eine weitere bevorzugte AusfOhrungsform des erfindungsgemaBen HCV-RNA-Konstrukts zeichnet sich 
dadurch aus, daB das Kbnstrukt wenigstens ein integriertes Reportergen aufweist. 

[0027] Unter Reportergen wird im folgenden jedes Gen verstanden, dessen Anwesenheit sich nach Uberfuhrung 
in einen Zielorganismus leicht und im allgemeinen mit einfachen biochemischen oder auch histochemischen Methoden 
nachweisen laBt, d.h. das fur ein Protein kodiert, welches auch in geringen Mengen einfach und zuveriassig mit den 
laborflblichen MeBmethoden nachgewiesen und quantifiziert werden kann. 

[0028] Diese Variante des HCV-RNA-Kbnstrukts hat den Vorteil, daB der Umfang der Replikation dieses Konstrukts 
anhand des Reportergenprodukts einfach und schnell mit laborQWichen Methoden gemessen werden kann. 
[0029] Das Reportergen ist vorzugsweise ein Gen aus der Gruppe der Luziferasegene, dem CAT-Gen (Chloram- 
phenicol-Acetyl-Transferase-Gen), dem lacZ-Gen (beta-Galaktosidasegen), dem GFP-Gen (green-fluorescence-pro- 
tein-Gen ), dem GUS-Gen (Glukuronidasegen) oder dem SEAP-Gen (Sezernerte-Alkalische-Phosphatase-Gen). 
Diese Reportergene bzw. deren Produkte, namlich die entsprechenden Reporterproteine, kOnnen z.B. mittels Fluores- 
zenz, Chemilumineszenz, colorimetrisch oder mit Hilfe immunologischer Methoden (z.B. ELISA) bestimmt werden. 
[0030] Als Reportergen kommt aber auch ein Suripgatmarkergen jn Betracht . Darunter sind in diesem Zusammen- 
hang solche Gene zu verstehen, die fur zelluiare Proteine, NuWeinsauren oder — allgemein —for solche Funktionen 
kodieren, die einer von der Virusreplikation abhangigen Variation unterliegen, und die infdgedessen in denjenigen Zel- 
len, in denen sich das HCV bzw. das HCV-RNA-Kbnstrukt vermehrt. entweder reprimiert oder aktiviert werden. Das 
heiBt: die Reduktion bzw. Aktivierung dieser Funktion ist ein Ersatzmarker fQr die Virusreplikation bzw. die Replikation 
des HCV-RNA-Konstrukts. 

[0031] Die Posrtionen von Reportergen und selektierbarem Markergen (Selektionsgen) kOnnen so gewahlt sein, 
daB ein aus den beiden Genprodukten gebildetes Fusionsprotein exprimiert wird. Hierbei besteht die vorteilhafte M6g- 
lichkeit daB diese beiden Gene so in dem HCV-RNA-Kbnstrukt angeordnet sind, daB ihre beiden exprimierten Proteine 
zunachst Qber eine Schnittstelle fOr eine Protease (z.B. Ubiquitin) oder Ober ein selbstspaltendes Peptid (z.B. das 2A- 
Protein der Picornaviren) fusioniert sind und erst spater proteolytisch wieder getrennt werden. 
Ebensogut kGnnen diese beiden Positionen aber auch derart getrennt voneinander liegen, daB beide Genprodukte 
separat exprimiert werden. (z.B. in der Reihenfolge: Marker- bzw. Resistenzgen — interne Ribosomenbindungsstelle 
— Reportergen). 

Im Fall des Reportergens hat sich eine Ausfuhrungsvariante besonders bewahrt, bei der das Reportergen in das offene 
Leseraster des HCV-Genoms oder -Subgenoms einWoniert ist, und zwar derart, daB es erst nach einer proteolytischen 
Prozessierung in eine aktive Form QberfOhrt wird. 

[0032] Das erf indungsgemaBe Zellkultursystem in alien seinen Variationen kann fur vierfaitige Zwecke eingesetzt 
werden. Diese umfassen: 

• Das Auffinden antiviral wirksamer Substanzen. Dies konnen beispielsweise sein: organische Verbindungen, die 
unmittelbar oder mittelbar in die Virusvermehrung eingreifen (z.B. InhibHoren der viralen Proteasen, der NS3-Heli- 
kase, der NS5B RNA-abhangigen RNA Polymerase), antisense OligonuWeotide, die an eine beliebige Zielsequenz 
innerhalb des HCV-RNA-Kbnstrukts (z.B. die 5' NTR) hybridisieren und unmittelbar oder mittelbar zu einer Beein- 
flussung der Virusvermehrung fQhren z.B. auf Grund einer Reduktion der Translation des HCV-Polyproteins oder 
Ribozyme, die eine beliebige HCV-RNA-Sequenz spalten und damit die Virusreplikation beeintrachtigen. 

• Die Evaluierung jeglicher Art antiviral wirksamer Substanzen in Zellkultur. Solche Substanzen kOnnen beispiels- 
weise mittels 'rational drug design' oder 'high-throughput screening' am isolierten gereinigten Enzym gefunden 
werden. Unter Evaluierung sind vor allem die Bestimmung der inhibitorischen Eigenschaften der entsprechenden 
Substanz sowie deren Wirkungsmechanismus zu verstehen. 
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Die Identif ikation neuer Angriffsziele, viralen Oder zellularen Ursprungs, fur eine HCV-spezrfische antiviraJe Th era- 
pie. 1st beispielsweise ein zellulares Protein essentiel) fur die Virusrepiikation, kann mittels Hemmung dieses zellu- 
laren Proteins die Virusrepiikation ebenfalls beeinfluBt werden. Das Auffinden solcher auxiliaren Faktoren ist mit 
dem erfindungsgemaBen System ebenfalls mOglich. 

5 • Der Einsatz fur die Resistenzbestimmung. Es ist anzunehmen, daB auf Grund der hohen Mutatiorrsrate des HCV- 
Genoms Therapieresistenzen auftreten. Solche Resistenzen, die gerade bet der Minischen ZuJassung einer Sub- 
stanz von groBer Bedeutung sind, lassen sich mit dem erfindungsgemaBen Zellkultursystem ermitteln. Zellinien in 
denen sich das HCV-RNA-Kbnstrukt bzw. das HCV-Genom oder - Subgenom repiiziert werden mit steigenden 
Konzentrationen der entsprechenden Substanz inkubiert und die Replication der viralen RNA wird entweder 

10 anhand eines eingebrachten Reporters Oder durch qualitative oder quantitative Bestimmung der viralen NuWein- 
sauren oder Proteine bestimmt Resistenz ist dann gegeben, wenn bei normaler Wirkstoffkonzentration keine 
Hemmung der Replikation zu beobachten ist Durch ReWonierung der HCV-RNA (z.B. mittels RT-PCR) und 
Sequenzanalyse kdnnen die fur Therapieresistenz verantwortlichen NuWeotid- bzw. Aminosaureaustausche ermit- 
telt werden. Durch EinWonieren der/des entsprechenden Austausche/s in das Ursprungskonstrukt kann deren 

75 Kausalitat fOr die Therapieresistenz bewiesen werden. 

Die ProdukrJon von authentischen Virusproteinen (Antigene) fur die Entwicklung und/oder Evaluierung von Diagno- 
stika. Das erfindungsgemaBe Zellkultursystem erlaubt auch die Expression von HCV-Antigenen in Zelikulturen. 
Diese Antigene kGnnen prinzipiell auch for den Aufbau diagnostischer Nachweisverfahren eingesetzt werden. 

• Die Produktion von HCV Viren und virus-ahnlichen Partikeln insbesondere zur Entwicklung oder Herstellung von 
20 Therapeutika und Impfstoffen sowie fur diagnostische Zwecke. Insbesondere zellkultur-adaptierte vollstandige 

HCV-Genome, die mit dem erfindungsgemaBen Zellkultursystem hergestelft werden kflnnen, sind in der Lage t mit 
hoher Effizienz in Zelikulturen zu repiizieren. Diese Genome besitzen alle Funkrjonen des HCV und sind deshalb 
in der Lage inf ektiCse Viren zu produzieren. 

25 [0033] Das erfindungsgemaBe HCV-RNA-Kbnstrukt fur sich genommen kann in alien seinen Variationen ebenfalls 
fur vielfaltige Zwecke eingesetzt werden. Dazu gehOren vor allem: 

• Die Kbnstruktjon attenuierter Hepatitis C Viren bzw. HCV-ahnlicher Partikel und deren ProdukrJon in Zelikulturen: 
Durch zufallige oder gezielt hervorgerufene Mutationen, beispielsweise Punktmutationen, Deletionen oder Insertio- 

30 nen, kBnnen attenuierte HCV- oder HCV-ahnliche Partikel erzeugt werden, d.h. Viren bzw. virusahnliche Partikel 
mit volier Replikationskompetenz aber verringerter bzw. fehlender Pathogenitat Solche attenuierte HCV- oder 
HCV-ahnliche Partikel sind insbesondere als Impfstoff einsetzbar. 

• Die Konstruktion von HCV-RNA-Kbnstrukten mit integrierten Fremdgenen, beispielsweise zur Verwendung als 
leberzellspezif ische Genfahren in der Gentherapie. Auf Grund des ausgepragten Leberzelrtropismus des HCV und 

35 der MSglichkeit, Teile des Genoms durch heterologe Sequenzen zu ersetzen, lassen sich HCV-RNA-Kbnstrukte 
herstellen, bei denen beispielsweise die Strukturproteine durch ein therapeutisch wirksames Gen ersetzt werden. 
Das so erhaltene HCV-RNA-Konstrukt wird in Zellen eingeschleust, vorzugsweise mittels Transfekb'on, die ale feh- 
lenden HCV-Funktionen, beispielsweise die Struturproteine, konstitutiv oder induzierbar exprimieren. Durch diese 
dem Fachmann unter dem Begriff der TranskorTplementation* bekannte Technik lassen sich Viruspartikel erzeu- 

40 gen, in die das HCV-RNA-Kbnstrukt eingebaut wird. Die so emartenen Partikel kflnnen fOr die Infektion vorzugs- 
weise von Leberzellen verwendet werden. In diesen wird das therapeutisch wirksame Fremdgen zur Expression 
gebracht und entraltet damit seine therapeutische Wirkung. 

Das Auffinden permissiver Zellen, d.h. Zellen, in denen eine produktive Virusvermehrung erfolgt. Zu diesem Zweck 
wird entweder eines der vorgenannten HCV-RNA-GenomkonstruWe verwendet, das zur Bildung kompletter infek- 

45 tiOser Viren befahigt ist, Oder es wird eines der vorgenannten HCV-Subgenom-Konstrukte eingesetzt, das aller- 
dings zunachst gemaB vorgenanrrtem Beispiel in eine Zellinie transfiziert wird, die die fehlenden Funkrjonen 
konstitutiv oder induzierbar exprimiert. In all diesen Fallen errtstehen Viruspartikel, die zusatzlich zur HCV- 
Sequenz ein Resistenz- und/oder Reportergen tragen. Zum Auffinden von Zellen, in denen das HCV repiizieren 
kann, werden diese Zellen mit den so hergestellten Viren infiziert und einer Antibiotikumsetektion unterzogen oder, 

so in Abhangigkeit vom HCV-RNA-Konstrukt, mittels Nachweis der Expression des Reportergens untersucht. Da eine 
Antibiotikumresistenz bzw. eine Expression des Reportergens nur dann nachweisbar ist, wenn das HCV-RNA-Kon- 
strukt repiiziert, mOssen die so gefundenen Zellen permiss'rv sein. Auf diese Weise lassen sich nahezu beliebige 
Zellinien oder primare Zelikulturen hinsichtlich der Permissivitat testen und auffinden. 

55 [0034] Das erfindungsgemaBe Zellkultursystem erlaubt auch das gezielte Auffinden von HCV-RNA-Konstrukten, 
bei denen es auf Grund von Mutationen, die sich entweder zufallig im Rahmen der HCV-RNA-Replikation ereignen 
oder die gezielt in das Kbnstrukt eingefuhrt werden, zu einer Steigerung der Replikationseff izienz kommt Solche Muta- 
tionen, die zu einer Veranderung der Replikation des HCV-RNA-Kbnstrukts fuhren, sind dem Fachmann als adaptive 
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Mutationen bekannt Die Erfindung umfaBtdeshalb auch Verfahren zur Gewinnung von zellkultur-adaptierten Mutanten 
eines erfindungsgemaBen HCV-RNA-Konstrukts gemaB vorstehender Beschreibung, wobei die Mutanten gegenuber 
dem originaren HCV-RNA-Konstrukt eine ertiOhte Replikationseffizienz aufweisen. Sie umfaBt desweiteren ein Verfah- 
ren zur Herstellung von Mutanten eines HCV-RNA-Voliangengenoms Oder eines HCV-RNA-Teilgenoms Oder eines 
5 beliebigen HCV-RNA-Konstrukts mit im Vergleich zu dem ursprunglichen HCV-RNA-Voliangengenom oder -Teilgenom 
Oder HCV-RNA-Kbnstrukt erhOhter Replikationseffizienz, sowie zellkultur-adaptierte Mutanten von HCV-RNA-Kon- 
strukten, HCV-Vollangengenomen und HCV-Teilgenomen mit im Vergleich zu den ursprOnglichen Konstrukten, Teil- 
oder Voliangengenomen erhOhter Replikationseffizienz. 

[0035] Das erfindungsgemaBe Verfahren zur Gewinnung von zellkultur-adaptierten Mutanten eines erfindungs- 
10 gemaBen HCV-RNA-Konstrukts, wobei die Mutanten gegenQber dem HCV-RNA-Konstrukt eine erh6hte Replikations- 
effizienz aufweisen, ist dadurch gekennzeichnet, daB man ein Zellkultursystem gemaB Anspruch 1, bei dem das 
eingeschleuste HCV-spezifische Genmaterial ein HCV-RNA-Konstrukt mit Selektionsgen nach einem der Anspruche 4 
bis 1 9 ist, auf/in dem dem Selektionsgen entsprechenden Selektionsmedium kuWviert, daB man die gewachsenen Zell- 
Wone erntet, und daB man aus diesen ZellWonen die HCV-RNA-Konstrukte isoliert. 
is [0036] Bei einer vorteilhaften Weiterbildung dieses Herstellungsverfahrens werden die isolierten HCV-RNA-Kon- 
strukte wenigstens einma! erneut passagiert, namlich in Zellen eines Zellkuttursystems nach Anspruch 1 einge- 
schleust, das dabei erhaltene Zellkultursystem gemaB Anspruch 1, bei dem das eingeschleuste HCV-spezifische 
Genmaterial das isolierte HCV-RNA-Konstrukt mit Selektionsgen ist auf/in dem dem Selektionsgen entsprechenden 
Selektionsmedium kultiviert, die gewachsenen ZellWone geerntet und daraus die HCV-RNA-Konstrukte isoliert. 
20 Mit dieser Verfahrensvariante kann der Grad der adaptiven Mutationen und damit der Grad der Replikationseffizienz in 
den betreffenden HCV-RNA-Konstrukten noch gesteigert werden. 

[0037] Das erfindungsgemaBe Verfahren zur Herstellung von Mutanten eines HCV - Voliangengenoms oder eines 
HCV- Teilgenoms oder eines beliebigen HCV-RNA-Konstrukts mit im Vergleich zu dem ursprOnglichen HCV- Voliangen- 
genom oder - Teilgenom oder HCV-RNA-Konstrukt erhdhter Replikationseffizienz zeichnet sich dadurch aus. daB man 

25 mit Hilfe eines der beiden vorstehend genannten Herstellungsverfahren eine zellkultur-adaptierte Mutante eines HCV- 
RNA-Kbnstrukts herstelrt, diese aus den Zellen isoliert, mit im Stand der Technik bekannten Methoden Woniert und 
sequenziert und durch Vergleich m'rt der NuWeotid- und Aminosauresequenz des ursprunglichen HCV-RNA-Kbnstrukts 
die Art, Anzahl und Positionen der Mutationen bestimmt, und diese Mutationen dann entweder durch gezierte Mutage- 
nese oder durch Austausch von Sequenzabschnitten, welche die betreffenden Mutationen enthatten, in ein (isoliertes) 

30 HCV-Voliangen- oder -teilgenom oder ein beliebiges HCV-RNA-Kbnstrukt einfQhrt. 

Zum Nachweis bzw. zur Verrf izierung derjenigen Mutationen, die tatsachlich eine Veranderung der Replikation und ins- 
besondere eine Replikationssteigerung bewirken, kann ein Test durchgefQhrt werden, bei dem die bestimmten NuWeo- 
tid- und/oder Aminosaureaustausche in das ursprQngliche HCV-RNA-Konstrukt eingefuhrt und dieses wiederum in 
Zellkultur eingeschleust wird. Wenn die eingefQhrte Mutation tatsachlich zu einer Steigerung der Replikation fohrt, 

35 solrte im Fall eines HCV-RNA-Konstrukts mit selektierbarem Markergen die Zahl der resistenten ZellWone bei dem 
kOnstlich mutierten Konstrukt deutlich hOher sein als bei dem unbehandelten Kbnstrukt. Im Fall eines Konstrukts mit 
einem Reportergen sollte die Aktivitat bzw. Menge des Reporters bei dem kunstlich mutierten Konstrukt deutlich hOher 
sein als bei dem unbehandelten. 

[0038] Die erfindungsgemaBen zellkultur-adaptierten HCV-RNA-Konstrukte mit hoher Replikationseffizienz sind 
40 dadurch gekennzeichnet, daB sie durch NuWeotid- und/oder Aminosaureaustausche von einem HCV-RNA-Kbnstrukt 
nach einem der AnsprGche 4 bis 19 ableitbar sind und daB sie mit einem der beiden vorstehend genannten Herstel- 
lungsverfahren erhattiich sind. 

[0039] Diese zellkultur-adaptierten HCV-RNA-Konstrukte kOnnen dazu verwendet werden, beliebige HCV-RNA- 
Konstrukte oder HCV-Volldngen- oder Teilgenome mit erhOhter Replikationseffizienz herzustellen. Dabei kOnnen 
45 sowohl Konstrukte mit einem selektierbaren Resistenzgen als auch Konstrukte ohne ein solches bzw. mit einem nicht- 
seiektierbaren Reportergen (z.B. Luziferase) hergestellt werden, denn aufgrund der sehr hohen Replikationseffizienz 
des zellkultur-adaptierten HCV-RNA-Konstrukts kann dessen Replikation auch in nicht-selektionierten Zellen nachge- 
wiesen werden. 

Die erfindungsgemaBen zellkultur-adaptierten Mutanten eines HCV-RNA-Konstrukts oder eines HCV-Voliangenge- 
50 noms oder eines HCV-Teilgenoms mit im Vergleich zu dem ursprOnglichen HCV-RNA-Kbnstrukt oder dem ursprOngli- 
chen HCV-Voliangengenom erhOhter Replikationseffizienz , sind dadurch charakterisiert, daB sie mit einem Verfahren 
erhaitlich sind, bei dem man in einem zellkultur-adaptierten HCV-RNA-Konstrukt durch Sequenzanalyse und Sequenz- 
vergleich die Art und Anzahl der Mutationen bestimmt und diese Mutationen in ein HCV-RNA-Kbnstrukt, insbesondere 
in ein HCV-RNA-Konstrukt gemaB einem der Anspruche 4 bis 19, Oder in ein (isoliertes) HCV-RNA-Voliangengenom 
55 einfQhrt, entweder durch gezierte Mutagenese oder durch Austausch von Sequenzabschnitten, die die betreffenden 
Mutationen entharten. 

[0040] Eine Gruppe ganz bevorzugter HCV-RNA-Konstrukte, HCV-Voliangengenome und HCV-Teilgenomen mit 
hoher und sehr hoher Replikationseffizienz und infolgedessen sehr guter Eignung fur die praktische Anwendung ist 
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dadurch gekennzeichnet, daB sie einen Oder mehrere Oder alle der in Tabelle 3 aufgelisteten AminosSure- bzw. NuWeo- 
tklaustausche und/oder einen Oder mehrereder folgenden AminosSureaustausche aufwetst: 1283 arg -> gly, 1383 glu 
-> ala . 1577 lys -> arg , 1609 lys -> glu , 1936 pro -> ser , 2163 glu -> gly , 2330 lys -> glu . 2442 ile -> val. (Die Zahlen 
beziehen sich auf die AminosSureposriionen des Polyproteins des HCV-lsolats con1 , siehe Tabelle 1). 

5 

Besondere Eigenschaften der in den Sequenzprotokollen angegebenen Sequenzen: 

SEQ ID-NO: 1 

w [0041] 

Name: l389/Core-3Vwt 
Aufbau (Nukeotidpositionen): 

is 1 . 1 -341 : HCV 5' nicht-translatierte Region 

2. 342-1 193: HCV Core Protein-Neomycin Phosphotransferase Fusionsprotein; selektionierbarer Marker 
3. 1202-1812: Interne Ribosomenbindungsstelle des Encephalomyokarditis Virus; eriaubt die Translation des 
dahinterliegenden HCV offenen Leserasters 

20 4. 1813-10842: HCV Polyprotein von Core bis Nichtstrukturprotein 5B 

5. 1813-2385: HCV Core Protein; Strukturprotein 

6. 2386-2961: HQIIprotein 1 (envelope protein 1); Strukturprotein 

7. 2962-4050: HQIIprotein 2 (envelope protein 2); Strukturprotein 

8.4051-4239: Protein p7 
25 9. 4240-4890: Nichtstrukturprotein 2 (NS2); HCV NS2-3 Protease 

10. 4891-6783: Nichtstrukturprotein 3 (NS3); HCV NS3 Protease/Helikase 

11. 6784-6945: Nichtstrukturprotein 4A (NS4A); NS3 Protease Kofektor 

12. 6946-7728: Nichtstrukturprotein 4B (NS4B) 

13. 7729-9069: Nichtstrukturprotein 5A (NS5A) 
30 14. 9070-10842: Nichtstrukturprotein 5B (NS5B); RNA-abhangige RNA-Polymerase 

15. 10846-11076: HCV 3' nicht-translatierte Region 

SEQ ID-NO: 2 

35 [0042] 

Name: l337/NS2-3'/wt 
Aufbau (Nukeotidpositionen): 

40 1.1 -341 : HCV 5' nicht-translatierte Region 

2. 342-1 181 : HCV Core Protein-Neomycin Phosphotransferase Fusionsprotein; selektionierbarer Marker 
3. 1 190-1800: Interne Ribosomenbindungsstelle des Encephalomyokarditis Virus; eriaubt die Translation des 
dahinterliegenden HCV offenen Leserasters 

45 

4. 1801-8403: HCV Polyprotein von Nichtstrukturprotein 2 bis Nichtstrukturprotein 5B 
5. 1801-2451: Nichtstrukturprotein 2 (NS2); HCV NS2-3 Protease 
6. 2452-4344: Nichtstrukturprotein 3 (NS3); HCV NS3 Protease/Helikase 
7. 4345-4506: Nichtstrukturprotein 4A (NS4A); NS3 Protease Kofaktor 
so 8. 4507-5289: Nichtstrukturprotein 4B (NS4B) 

9. 5290-6630: Nichtstrukturprotein 5A (NS5A) 

10. 6631-8403: Nichtstrukturprotein 5B (NS5B); RNA-abhangige RNA-Polymerase 
11. 8407-8637: HCV 3' nicht-translatierte Region 

55 
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SEQ ID-NO: 3 
[0043] 

5 Name: l389/NS3-37Wt 

Aufbau (NuWeotidpositionen): 

1. 1-341 : HCV 5' nicht-translatierte Region 

2. 342-1 193: HCV Core Protein-Neomycin Phosphotransferase Fusionsprotein; selektionierbarer Marker 
10 3. 1202-1812: Interne Ribosomenbindungsstelle des Encephalomyokarditis Virus; erlaubt die Translation des 

dahinterliegenden HCV offenen Leserasters 

4. 1813-7767: HCV Poiyprotein von Nichtstrukturprotein 3 bis Nichtstrukturprotein 5B 

5. 1813-3708: Nichtstrukturprotein 3 (NS3); HCV NS3 Protease/Helikase 
75 6. 3709-3870: Nichtstrukturprotein 4A (NS4A); NS3 Protease Kofaktor 

7. 3871-4653: Nichtstrukturprotein 4B (NS4B) 

8. 4654-5994: Nichtstrukturprotein 5A (NS5A) 

9. 5995-7767: Nichtstrukturprotein 5B (NS5B); RNA-abhangige RNA-Polymerase 

10. 7771-8001 : HCV 3' nicht-translatierte Region 

20 

SEQ ID-NO: 4 
[0044] 

25 Name: l337/NS3-3Vwt 

Aufbau (NuWeotidpositionen): 

1 . 1 -341 : HCV 5* nicht-translatierte Region 

2. 342-1 181 : HCV Core Protein-Neomycin Phosphotransferase Fusionsprotein; selektionierbarer Marker 
so 3. 1 190-1800: interne Ribosomenbindungsstelle des Encephalomyokarditis Virus; erlaubt die Translation des 

dahinterliegenden HCV offenen Leserasters 

4. 1801-7758: HCV Poiyprotein von Nichtstrukturprotein 3 bis Nichtstrukturprotein 5B 

5. 1801-3696: Nichtstrukturprotein 3 (NS3); HCV NS3 Protease/Helikase 
35 6. 3697-3858: Nichtstrukturprotein 4A (NS4A); NS3 Protease Kofaktor 

7. 3859-4641 : Nichtstrukturprotein 4B (NS4B) 

8. 4642-5982: Nichtstrukturprotein 5A (NS5A) 

9. 5983-7755: Nichtstrukturprotein 5B (NS5B); RNA-abh&ngige RNA-Polymerase 
10. 7759-7989: HCV 3 nicht-translatierte Region 

40 

SEQ ID-NO: 5 
[0045] 

45 Name: l389/NS2-37wt 

Aufbau (NuWeotidpositionen): 

1. 1-341 : HCV 5' nicht-translatierte Region 

2. 342-1 193: HCV Core Protein-Neomycin Phosphotransferase Fusionsprotein; selektionierbarer Marker 
so 3. 1202-1812: Interne Ribosomenbindungsstelle des Encephalomyokarditis Virus; erlaubt die Translation des 

dahinterliegenden HCV offenen Leserasters 

4. 1813-8418: HCV Poiyprotein von Nichtstrukturprotein 2 bis Nichtstrukturprotein 5B 

5. 1813-2463: Nichtstrukturprotein 2 (NS2); HCV NS2-3 Protease 
55 6. 2464-4356: Nichtstrukturprotein 3 (NS3); HCV NS3 Protease/Helikase 

7. 4357-4518: Nichtstrukturprotein 4A (NS4A); NS3 Protease Kofaktor 

8. 4519-5301 : Nichtstrukturprotein 4B (NS4B) 

9. 5302-6642: Nichtstrukturprotein 5A (NS5A) 
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10. 6643-6415: Nichtstrukturprotein 5B (NS5B); RNA-abhSngige RNA-Polymerase 
1 1 . 8419-8649: HCV 3* nicht-translatierte Region 



SEQ ID-NO: 6 

[0046] 

Name: I389/NS3-379-13F 
Aufbau (Nukieotidpositionen): 

1 . 1 -341 : HCV 5' nicht-translatierte Region 

2. 342-1193: HCV Core Protein- Neomycin Phosphotransferase Fusionsprotein; selektionierbarer Marker 
3. 1202-1812: Interne Rtoosomenbindungsstelle des Encephalomyokarditis Virus; erlaubt die Translation des 
dahinterfiegenden HCV offenen Leserasters 

4. 1813-7767: HCV Polyprotein von Nichtstrukturprotein 3 bis Nichtstrukturprotein 5B der zellkultur-adaptier- 
tenMutante9-13F 



5. 1813-3708: Nichtstrukturprotein 3 (NS3); HCV NS3 Protease/Helikase 

6. 3709-3870: Nichtstrukturprotein 4A (NS4A); NS3 Protease Kbfaktor 

7. 3871-4653: Nichtstrukturprotein 4B (NS4B) 

8. 4654-5994: Nichtstrukturprotein 5A (NS5A) 

9. 5995-7767: Nichtstrukturprotein 5B (NS5B); RNA-abhangige RNA-Polymerase 7771-8001: HCV 3' 
nicht-translatierte Region 



SEQ ID-NO: 7 
[0047] 

Name: l389/Core-3'/9-13F 
Aufbau (Nukieotidpositionen): 

1 . 1 -341 : HCV 5' nicht-translatierte Region 

2. 342-1193: HCV Core Protein- Neomycin Phosphotransferase Fusionsprotein; selektionierbarer Marker 
3. 1202-1812: Interne Ribosomenbindungsstelle des Encephalomyokarditis Virus; erlaubt die Translation des 
dahinterliegenden HCV offenen Leserasters 

4. 1813-10842: HCV Polyprotein von Core bis Nichtstrukturprotein SBderzellkultur-adaptierten Mutante9-13F 



5. 1813-2385: HCV Core Protein; Strukturprotein 

6. 2386-2961: Hullprotein 1 (envelope protein 1); Strukturprotein 

7. 2962-4050: HOIIprotein 2 (envelope protein 2); Strukturprotein 

8. 4051-4239: Protein p7 

9. 4240-4890: Nichtstrukturprotein 2 (NS2); HCV NS2-3 Protease 

10. 4891-6783: Nichtstrukturprotein 3 (NS3); HCV NS3 Protease/Helikase 
11. 6784-6945: Nichtstrukturprotein 4A (NS4A); NS3 Protease Kbfaktor 
12. 6946-7728: Nichtstrukturprotein 4B (NS4B) 
13. 7729-9069: Nichtstrukturprotein 5A (NS5A) 

14. 9070-10842: Nichtstrukturprotein 5B (NS5B); RNA-abhdngige RNA-Polymerase 
15. 10846-1 1076: HCV 3' nicht-translatierte Region 



SEQ ID-NO: 8 

[0048] 

Name: I389/NS3-375.1 
Aufbau (Nukieotidpositionen): 

1 . 1 -341 : HCV 5* nicht-translatierte Region 

2. 342-1 193: HCV Core Protein- Neomycin Phosphotransferase Fusionsprotein; selektionierbarer Marker 
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3. 1202-1812: Interne Ribosomenbindungsstelle des Encephalomyokarditis Virus; erlaubt die Translation des 
dahinterliegenden HCV offenen Leserasters 

4. 1813-7767: HCV Polyprotein von Nichtstrukturprotein 3 bis Nichtstrukturprotein 5B der zellkultur-adaptier- 
ten Mutante 5.1 

5. 1813-3708: Nichtstrukturprotein 3 (NS3); HCV NS3 Protease/Helikase 

6. 3709-3870: Nichtstrukturprotein 4A (NS4A); NS3 Protease Kbfaktor 

7. 3871-4653: Nichtstrukturprotein 4B (NS4B) 
8. 4654-5994: Nichtstrukturprotein 5B (NS5A) 

9. 5995-7767: Nichtstrukturprotein 5B (NS5B); RNA-abhangige RNA-Polymerase 7771-8001: HCV 3* 
nicht-translatierte Region 

SEQ ID-NO: 9 

[0049] 

Name: !389/Core-3V5.1 
Autoau (NuWeotidpositionen): 

1. 1-341: HCV 5* nicht-translatierte Region 

2. 342-1193: HCV Core Protein-Neomycin Phosphotransferase Fusionsprotein; selektionierbarer Marker 
3. 1202-1812: Interne Ribosomenbindungsstelle des Encephalomyokarditis Virus; erlaubt die Translation des 
dahinterliegenden HCV offenen Leserasters 

4. 1813-10842: HCV Polyprotein von Core bis Nichtstrukturprotein 5B der zellkultur-adaptierten Mutante 5.1 

5. 1813-2385: HCV Core Protein; Strukturprotein 
6. 2386-2961: Hullprotein 1 (envelope protein 1); Strukturprotein 
7. 2962-4050: Hullprotein 2 (envelope protein 2); Strukturprotein 
8. 4051-4239: Protein p7 

9. 4240-4890: Nichtstrukturprotein 2 (NS2); HCV NS2-3 Protease 

10. 4891-6783: Nichtstrukturprotein 3 (NS3); HCV NS3 Protease/Helikase 

11. 6784-6945: Nichtstrukturprotein 4A (NS4A); NS3 Protease Kbfaktor 

12. 6946-7728: Nichtstrukturprotein 4B (NS4B) 

13. 7729-9069: Nichtstrukturprotein 5A (NS5A) 

14. 9070-10842: Nichtstrukturprotein 5B (NS5B); RNA-abhangige RNA-Polymerase 
15. 10846-1 1076: HCV 3' nicht-translatierte Region 

SEQ ID-NO: 10 

[0050] 

Name: I389/NS3-3719 
Aufbau (NuWeotidpositionen): 

1 . 1 -341 : HCV 5* nicht-translatierte Region 

2. 342-1 193: HCV Core Protein-Neomycin Phosphotransferase Fusionsprotein; selektionierbarer Marker 
3. 1202-1812: Interne Ribosomenbindungsstelle des Encephalomyokarditis Virus; erlaubt die Translation des 
dahinterliegenden HCV offenen Leserasters 

4. 1813-7767: HCV Polyprotein von Nichtstrukturprotein 3 bis Nichtstrukturprotein 5B der zellkultur-adaptier- 
ten Mutante 19 

5. 1813-3708: Nichtstrukturprotein 3 (NS3); HCV NS3 Protease/Helikase 
6. 3709-3870: Nichtstrukturprotein 4A (NS4A); NS3 Protease Kbfaktor 

7. 3871-4653: Nichtstrukturprotein 4B (NS4B) 

8. 4654-5994: Nichtstrukturprotein 5A (NS5A) 

9. 5995-7767: Nichtstrukturprotein 5B (NS5B); RNA-abh&ngige RNA-Polymerase 7771-8001: HCV 3' 
nicht-translatierte Region 
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SEQ ID-NO: 11 
[0051] 

Name: t389/Core-3'/19 
Aufbau (NuWeotidpositionen): 

1. 1-341: HCV 5' nicht-translatierte Region 

2. 342-1193: HCV Core Protein-Neomycin Phosphotransferase Fusionsprotein; selektionierbarer Marker 
3. 1202-1812: Interne Ribosomenbindungsstelle des EncephalomyokardHis Virus; ertaubt die Translation des 
dahinterfiegenden HCV offenen Leserasters 

4. 1813-10842: HCV Polyprotein von Core bis Nichtstrukturprotein 5B der zellkuttur-adaptierten Mutante 19 

5. 1813-2385: HCV Core Protein; Strukturprotein 
6. 2386-2961: HOIIprotein 1 (envelope protein 1); Strukturprotein 
7. 2962-4050: HOIIprotein 2 (envelope protein 2); Strukturprotein 
8. 4051-4239: Protein p7 

9. 4240-4890: Nichtstrukturprotein 2 (NS2); HCV NS2-3 Protease 

10. 4891-6783: Nichtstrukturprotein 3 (NS3); HCV NS3 Protease/Helikase 

1 1 . 6784-6945: Nichtstrukturprotein 4A (NS4A); NS3 Protease Kofektor 

12. 6946-7728: Nichtstrukturprotein 4B (NS4B) 

13. 7729-9069: Nichtstrukturprotein 5A (NS5A) 

14. 9070-10842: Nichtstrukturprotein 5B (NS5B); RNA-abhangige RNA-Polymerase 
15. 10846-1 1076: HCV 3' nicht-translatierte Region 

[0052] Die Erfindung wird im folgenden anhand von AusfQhrungsbeispielen und dazugehOrigen Tabellen und Figu- 
ren naher eriautert Die erwahnten Figuren zeigen 

Rg. 1 A: Die Struktur eines erfindungsgemaBen HCV-RNA-Konstrukts Ganz oben ist eine schematische Darstel- 
lung der Struktur des kompletten parentalen HCV-Genoms gegeben rrrit den Positionen der Gene fur die 
Spaltungsprodukte core, E1 ( E2, p7, NS2, NS3, NS4A, NS4B, NS5A und NS5B innerhalb des Polypro- 
teins, und den 5* und 3' nichttranslatierten Regionen (5* NTR und 3* NTR) — als Horizorrtalbalken darge- 
stellt — , und mit den beiden for die Erzeugung der Subgenom-Konstrukte ausgewahlten Positionen, 
namlich der Position der 'GDD-katalytischen Domane* der NS5B RNA Polymerase (GDD) und der Posi- 
tion der 3' Grenze der HCV-IRES (NuWeotidpositionen 1 bis 377 bzw. 1 bis 389) — oberhalb des Genom- 
schemas eingezeichnet — . Die Zahlen unterhalb des Genomschemas bezeichnen die entsprechenden 
NuWeotidpositionen. 

Darunter sind schematische Darstellungen der Strukturen zweier erfindungsgemaSer, modrfizierter 
HCV-RNA-Konstrukte (Subgenom) gezeigt, bestehend aus der 5' HCV-IRES, dem Neomycinphospho- 
transferasegen (Neo*), der EMCV-IRES (E-l) und den HCV Sequenzen von NS2 bzw. NS3 bis zum 
authentischen 3' Ende. Die Position der das NS5B Polymerase GDD-Motiv umfassenden 10 Aminosau- 
ren-Deletion ist jeweils mit einem Dreieck (A) markiert. 

Rg. 1 B: Das Ergebnis einer denaturierenden Formaldehyd-Agarose-Gelelektrophorese zum Nachweis von repli- 
zierter Plusstrang-RNA in transf izierten subpassagierten Huh-7 ZellWonen. 

Die Positionen der HCV-spezrfischen RNAs (Pfeile) und der 28S rRNA sind rechts von Spur 12 angege- 
ben, die GrOBen (Anzahien der NuWeotide) der RNA-Marker (M) sind links von Spur 1 angegeben. 

Rg. 1 C : Das Ergebnis eines PCR-Tests mit nachfolgendem Southern-Blot zum Nachweis der Abwesenheit von 
integrierter Replikon-DNA in den meisten der seiektierten ZellWone. 

Spuren 1 und 2 zeigen die Positivkontrollen, Spur 13 die Negativ-Kontrolle. Die Zahlenangaben links der 
Spur 1 bezeichnen die GrOfJe der NuWeotid-Marker-Molekule. 

Rg. 2 A: Das Ergebnis eines PCR-Tests mit nachfolgendem Southern-Blot zum sensitiven AusschluB integrierter 
Replikon-DNA (Plasmid MolekOIe \ Z77 /MS3-3M) in einem HCV-RNA-Konstrukt-haltigen ZellWon (9-13). 
Die Spuren 7 bis 1 1 reprasentieren das Ergebnis einer Titration von DNA-Molekfllen des Kbnstrukts 
l 377 /NS3-3'/wt ohne Zugabe von Gesamt-DNA des Zellkions 9-13 und die Spuren 2 - 6 reprasentieren 
die gleichen PlasmidmolekOle mit Zugabe von jeweils 1 jog 9-13 DNA vor der PCR (zwecks AusschluB 
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eines Inhibitors der PCR in der DNA-Praparation). Spur 13 reprasentiert die Negativ-Kbntrolle (PCR 
ohne DNA-Sonde). Spur 1 zeigt das Ergebnis, das mit einem p.g Gesamt-DNA des Zellkons 9-13 erhal- 
ten wurde. 

5 Rg. 2 B: Das Ergebnis eines Northern-Blot-Tests zur Quantifizierung von HCV Plus- und Minusstrang RNA. 

Die Pteile markieren die Positionen von Replikon-RN A. Die "plus" und "minus" -Abgaben bezeichnen die 
positive (plus) bzw. negative (minus) Polaritat der RNA-Kontrollen, die auf das Gel aufgetragen wurden. 
"Minusstrand" und "Plusstrand" bezeichnen die Spezif itat der radioaktiven RNA-Sonden. 

70 Rg. 2 C: Ergebnis einer Formaldehyd-Agarose-Gelelektrophorese nach radioaktiver MarWerung der intrazelluiar 
replizierten HCV- RNA zum Nachweis der Resistenz der HCV-RNA-Replikation gegen Dactinomycin. 

Rg. 3 A: Nachweis von HCV-spezif ischen Antigenen in den selektierten ZellWonen mittels Immunoprazipitation 
nach metabolischer Radioaktivmarkierung. Die Spuren 7 - 9 reprasentieren authentische GrOBenmarker 
is (die nach transienter Expression eines HCV-RNA-Konstrukts in Huh-7-Zellen erhalten wurden); identifi- 

zierte HCV-Proteine sind am Iinken Rand von Spur 1 markiert, die Molekulargewicrrte (in Kilodalton) sind 
am rechten Rand von Spur 9 angegeben. 

Rg. 3 B: Ergebnisse eines Immunf luoreszenztests zum Nachweis der subzelluiaren Lokalisation von HCV Antige- 
20 nen. 

Rg. 4: Schematische Darstellung der Struktur eines erfindungsgemaBen selektierbaren HCV-RNA-Konstrukts 
(komplettes Genom) bestehend aus der 5* HCV-IRES, dem Neomycinphosphotransferasegen (NeoR), 
einem heterologen IRES-Element, z.B. des Encephalomyocarditisvirus (E-l), dem vollstandigen HCV- 
25 Leseraster und der authentischen 3' NTR. 

Rg. 5: Schematische Darstellung der Struktur von HCV-RNA-Konstrukten mit insertiertem Antibiotikumresi- 
stenzgen (A) innerhalb der fur das Polyprotein kodierenden Nukleotidsequenz (monocistronische RNA), 
und (B) innerhalb der 3' NTR (bicistronische RNA). 

30 

Rg. 6: Schematische Darstellung der Struktur von HCV-RNA-Konstrukten mit insertiertem Reportergen (A) als 
Teil eines HCV-Replikons von NS3 bis NS5B; — das Reporterprotein wird letztendlich durch virale oder 
durch zelluiare Proteasen aus dem Polyprotein gespalten und das selektierbare Markergen (Selektions- 
gen) bzw. das Resistenzgen durch Kbntransfektion in die Zellen einschleust , (B) als Teil eines Fusions- 

35 gens aus Resistenz- und Reportergen (z.B. fur die Neomycinphosphotransferase und green fluorescent 

Protein) (C) als Teil eines Replikons aus Resistenz- und Reportergen (z.B. fur die Neomycinphospho- 
transferase und das green fluorescent Protein), die uber eine Nukleotidsequenz verbunden sind, welche 
fQr eine Aminosauresequenz kodiert (schraffierter Bereich), die von einer Protease gespalten werden 
kann oder die uber eine selbstspaltende (autokatafytische) Aktivhat verfugt, (D) als unabhangiges Gen 

40 (hier green fluorescent protein), das von einer eigenen internen Ribosomenbindungsstelle (IRES) aus 

exprimiert wird; — das Resistenzgen (hier: Neomycinphosphotransferase-Gen) wird davon unabhangig 
ebenfalls von einer eigenen internen Ribosomenbindungsstelle (IRES) aus exprimiert (polycistronisches 
Kbnstrukt). 

45 Rg. 7: Schematische Darstellung der Struktur eines HCV-RNA-Konstrukts bei dem das Resistenzgen Qber ein 
Ribozym bzw. eine Erkennungsstelle fur ein Ribozym mit der HCV-RNA-Sequenz verbunden ist. Die dik- 
ken Linien stellen die HCV 5' und 3' NTRs dar, E-l ist eine heterologe interne Ribosomenbindungsstelle, 
die for die Expression des Resistenzgens notwendig ist, und das graue Quadrat stellt das Ribozym bzw. 
eine Erkennungsstelle fQr ein Ribozym dar. 

50 

Rg. 8: Schematische Darstellung der Struktur eines HCV-RNA-Konstrukts mit Resistenzgen und integriertem 
Fremdgen. 

Rg. 9: Methodisches Vorgehen zum Vergleich der spezif ischen Infektiositdt (ausgedruckt als Anzahl gebildeter 
55 Zellkolonien) von Gesamt-RNA versus in vitro Transkripte. HCV- RNA wird mittels in vitro Transkription 

eines entsprechenden RNA-Konstrukts hergestellt und durch Messung der optischen Dichte bei 260 nm 
(OD 260 nm) quantifiziert. Eine definierte Anzahl dieser Molekule wird mit einer bestimmten Menge 
Gesamt-RNA von naTven Huh-7 Zellen gemischt und diese Mischung mit Hilfe der Elektroporation in 
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naive Huh- 7 Zellen eingeschleust. Parallel dazu wird die Gesamt-RNA eines ZellWons, der mit der in 
Rgur 1 beschriebenen Methods hergesteltt wurde, mit einem im Stand der Technik bekannten Verfahren 
isoliert und die Menge der darin enthaftenen HCV- RNA mittels Northern-blot unter Verwendung einer 
HCV-spezifischen RNA-Sonde und anschlieBender Quarrtifizierung mittels Phosphdmager bestimmt. 

5 Eine definierte Menge dieser Gesamt-RNA wird analog den in vitro Transkripten in naive Huh-7 Zellen 

transfiziert Diese Zellen in beiden Ansatzen werden danach einer G418-Selektion unterzogen und die 
Anzahl der gebildeten Kolonien durch Auszahlen nach fbderen und anfarben mh Coomasste-Briliiant- 
Blau bestimmt Zur Bestimmung der TransfeWionseffizienz wird jedem Transfektionsansatz 1^ eines 
Plasmids zugesetzt, das die Expression der Luzrferase erlaubt Ein Aliquot der transfizierten Zellen wird 

w nach 24 Stunden geemtet und die Luziferaseaktivitat im jeweiligen Zellysat bestimmt. Die Anzahl der 

Kolonien wird jeweils auf die Luziferaseexpression normiert. 




Fig. 10: Sequenzanalyse der 9-13 Klone. Gesamt-RNA des ZellWons 9-13, der durch Transfektion des HCV- 
RNA-Kbnstrukts I377/NS3-3* entstand, wurde mit einem im Stand der Technik bekannten Verfahren iso- 

75 liert und das HCV-RNA-Konstrukt von Nukleotidposition 59 bis 9386 mit Hilfe der 'long-distance RT-PCR' 

unter Verwendung der primer S59 und A9413 amplizifiert. Die PCR-Fragmente wurden Woniert und 1 1 
Klone (genannt 9-13 A - K) vollstandig sequenziert, wobei sich die Klone D und I, E und G sowie H und 
J als identisch erwiesen. Die Positionen der Aminosaureunterschiede in der NS3-5B Region zwischen 
den reWonierten HCV-RNAs und dem parentalen Konstrukt sind mit einem dicken vertikalen Strich beim 

20 jeweiligen Klon marWert Jeder Won wurde mit dem Restriktionsenzym Sfi 1 verdaut und das jeweilige 

Fragment in das parentale Konstrukt inseriert. Diese Klone wurden jeweils in Huh-7 Zellen transfiziert 
und die Zellen wie in Rgur 1 beschrieben einer Selektion unterzogen. Die Anzahl der mit jedem Kon- 
strukt erhaltenen ZeilMone 1st rechts neben dem jeweiligen Konstrukt vermerkt. 

25 Fig. 11 A: Prinzip der Replikationsbestimmung mit Hilfe eines Reportergens. Im oberen Teil der Rgur ist das HCV- 
DNA-Kbnstrukt Ijjgg/Luc/NSS-S' dargestellt bestehend aus der HCV 5' NTR (Nukleotidposition 1-389), 
dem Luziferasegen (/i/c), der IRES des Encephalomyocarditis Virus, dem HCV NS3-5B und der 3' NTR. 
Die Position des aktiven Zentrums der NS5B RNA-Polymerase, in das ein inaktivierender Aminosaure- 
austausch eingefuhrt wurde, ist mit *GND' angedeutet. Die Plasmide, die for das repiikationskompetente 

30 bzw. das defekte HCV-RNA-Konslrukt kocfieren, werden mit dem Restriktionsenzym Sea I verdaut und 

in eine in vitro Transkription mit der T7 RNA-Polymerase eingesetzt. Nach Entfernung der Matrizen-DNA 
werden die jeweiligen HCV-RNA-Kbnstrukte mittels Elektroporation in naive Huh-7 Zellen eingeschleust 
und diese in regelmaBigen Abstanden geerntet. 

35 Rg. 11 B: Vergleich der Luziferaseaklivitaten in Zellen transfiziert mit dem parentalen HCV-RNA-Kbnstrukt 
kas/Luc/NSS-SYwt (wt) Oder den fblgenden Varianten: Der inaktiven RNA (318 DN), der Variante 9-13F 
Oder der Variante 5.1. Die Zellen wurden 6 (nicht gezeigt), 24, 48, 72, 96, 120, 144 und 168 Stunden 
nach der Transfektion geerntet und die Luziferaseaktivitaten luminometrisch bestimmt 

40 Rg. 12: Selektionierbare HCV-Voliangengenome (Konstrukte l389/core-375.1 und l 389 /core-3y9-13F). 

(A) Schematische Darstellung des Voliangenkonstrukts. Der Bereich zwischen den beiden ange- 
deuteten Erkennungsstellen fQr das Restriktionsenzym Sfi I entspricht den Sequenzen der hoch- 
adaptierten RNA-Varianten 5.1. oder 9-13F. 
45 (B) Anzahl der Kolonien die nach Transfektion von jeweils 0,1 fig in vitro transkribierter RNA der 

unter A dargestellten Konstrukte l 389 /core-375.1 in HUH7-Zellen erhalten wurden. Angegeben ist 
das Ergebnis eines repraserrtativen Experimerrtes. 

(C) Nachweis autonom repiizierender HCV-VoIiangen-RNAs in G418-resistenten ZellWonen, die 
nach Transfektion des entsprechenden in vitro Transkripts erhalten wurden. Die Abbildung zeigt das 

so Autoradiogramm eines Northern Blots, der mit einer Sonde gegen das neo-Resistenzgen und der 

HCV 5* NTR hybridisiert wurde. Die in Spur 1 und 2 dargestellten Kontrollen entsprechen jeweils 10 s 
MolekOlen der angegebenen in vitro Transkripte, gemischt mit Gesamt-RNA aus naiven Huh-7 Zel- 
len. Die Negativkontrolle enthait ausschlieBlich Gesamt RNA aus naiven Huh-7 Zellen (Spur 3). Die 
Spuren 4-9 enthalten 3-10 *xg Gesamt-RNA aus G418-resistenten ZellWonen, die nach Transfektion 

55 von in vitro transkribierter l 389 /core-375.1-RNA bzw. l 389 /core-3y9-13F-RNA erhalten wurden. Die 

for die Selektion verwendete G41 8-Konzentration ist jeweils angegeben. FOnf der dargestellten Zeil- 
Mone enthalten die hoch adaptierte RNA- Variante 5. 1 (Spur 4-8), einer die adaptierte RNA- Variante 
9-13F (Spur 9). 
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Fig. 13: HCV-RNA-Konstrukte mit einem Reportergen. (A) Bicistronische HCV-RNA-Konstrukte. Das Reporter- 
gen wird mit Hilfe einer separaten IRES translated (B) Monocistronische HCV-RNA-Konstrukte. Das 
Reportergenprodukt wird als Fusionsprotein mit einem HCV-Protein exprimiert Die beiden Arrteile sind 
Qber eine Erkennungssequenz fur eine virale oder zelluiare Protease verbunden, die eine proteolytische 
Trennung der beiden fusionierten Proteinanteile erlaubt. Im gezeigten Beispiel wurden das Reportergen- 
produkt und das jeweilige HCV-Protein Qber eine Erkennungssequenz fur Ubiquitin (Ub) fusioniert. 

Fig. 14: Tricistronisches Vollfingen HCV-RNA-Kbnstrukt, das zusatzlich zum Res'rstenzgen ein Fremdgen inse- 
riert besitzt. 



Fig. 15: Monocistronische HCV-RNA-Konstrukte, bei denen das Resistenzgenprodukt als Fusionsprotein mit 
dem HCV-Anteil exprimiert wird. Das Resistenzgen (RG) ist entweder als Fusionsprotein aktiv oder es 
wird so mit einer proteolytisch spartbaren Sequenz mit dem HCV-Anteil fusioniert daB das Resistenz- 
genprodukt durch eine zelluiare oder virale Protease vom HCV-Anteil abgesparten wird. Im gezeigten 
is Beispiel wurde das Resistenzgen Qber die fur Ubiquitin (Ub) kodierende Sequenz mit dem jeweiligen 

HCV-Anteil fusioniert. 

Beispiel 1 : Herstellung von HCV-RNA-Konstrukten 

20 (A) Svnthese und Klonieruna eines vollstandiaen HCV-Kbnsensuspenoms mittels RT- PCR 

[0053] Aus der Leber eines chronisch infizierten Patienten wurde das HCV-Genom, d.h. die HCV-RNA wie nachfol- 
gend beschrieben isoliert: 

[0054] Aus ca. 100 mg Leber wurde die komplette RNA gemafc dem Verfahren von ChomczynsW und Sacci (1 987, 

25 Anal. Biochem. 162, 156) isoliert. Mit 1 jig dieser isolierten RNA wurde eine reverse Transkription mit den Primern 
A6103 (GCTATCAGCCGGTTCATCCACTGC) oder A9413 (CAGGATGGCCTATTGG CCTGGAG) und dem 'expand 
reverse transcriptase'- System (Boehringer Mannheim, Deutschland) nach den Vorschrrften des Herstellers durchge- 
fuhrt. Mit den Produkten dieser reversen Transkription (RT) wurde eine Polymerase-Kettenreaktion (PCR=polymerase 
chain reaction) durchgefuhrt, und zwar unter Verwendung des 'expand long template'-Systems (Boehringer Mannheim, 

30 Deutschland), wobei der Puffer mit 2% Dimethylsulfoxid-Gehalt eingesetzt wurde. Nach einer Stunde bei 42°C wurde 
1/8 dieses Reaktionsansatzes in einem ersten PCR-Durchgang mit den Primern A6103 und S59 (TGTCTTCACGCA- 
GAAAGCGTCTAG) oder A9413 und S4542 (GATGAGCT CGCCGCGAAGCTGTCC) eingesetzt. Nach 40 ZyHen 
wurde 1/10 dieses Reaktionsansatzes in einem zweiten PCR-Durchgang mit den Primern S59 und A4919 (AGCACA- 
GCCCGCGTCATAGCACTCG) oder S4542 und A9386 (TTAGCTCCCCG TTCATCGGTTGG) eingesetzt Nach 30 

35 Zyklen wurden die PCR-Produkte mittels prdparativer Agarose-Gel-Elektrophorese gereinigt und die dabei eluierten 
Fragmente wurden in den Vektor pCR2. 1 (Invitrogen) oder pBSK II (Stratagene) ligiert. Vier Klone von jedem Fragment 
wurden analysiert und sequenziert, und es wurde eine Konsensus-Sequenz ermittelt Zu diesem Zweck wurden die 
DNA-Sequenzen miteinander verglichen. Die Positionen, an denen sich die Sequenz eines der Fragmente von den 
Dbrigen unterschied, wurde als unerwunschte Mutation betrachtet. Im Fall von Mehrdeutigkeiten der Sequenz wurden 

40 kOrzere sich Qberlappende PCR-Fragmente der betreffenden Region amplrf iziert und mehrere Klone sequenziert. Auf 
diese Weise konrrten zahlreiche potentielle Mutationen in jedem Fragment identifiziert und somit eine isolat-spezrf ische 
Konsensussequenz etabliert werden. Diese etablierte Konsensussequenz bzw. dieses Genom gehOrt zum weftweit 
verbreiteten Genotyp 1 b. Die nicht translatierte Region am 3'-Ende (=3' NTR) wurde mittels konventioneller PCR erhal- 
ten, wobei ein Antisense-Primer eingesetzt wurde, der die letzten 24 NuWeotide des im Stand der Technik bekannten 

45 •X-tails' (Tanaka et al. v 1995, Biochem. Biophys. Res. Commun. 215, 744; und Rice, PCT/US 96/14033) abdeckt. Die 
authentische nicht translatierte Region am 5-Ende (=5* NTR) strangabwarts vom T7 Promotor wurde mittels PCR 
erzeugt, wobei zum einen ein OligonuWeotid verwendet wurde, das einem verkOrzten T7 Promotor (TAA TAC GAC TCA 
CTA TAG) und den ersten 88 NuWeotiden von HCV entspricht, und zum anderen eines der vorgenannten Plasmide ein- 
gesetzt wurde, das eines der 5* Fragmente des Genoms tragi Aus den subgenomischen Fragmenten mit der gering- 

so sten Anzahl an Nicht-Konsensus-Austauschen wurde ein komplettes HCV-Kbnsensusgenom zusammengesetzt und in 
einen modifizierten pBR322-Vektor insertiert. Abweichungen von der Konsensussequenz wurden mittels ortsgerichte- 
ter Mutagenese ("site-directed mutagenesis) beseitigt. Urn "run-ofT-Transkripte mit einem authentischen 3' Ende her- 
zustellen, wurde die 3'-NTR der Isolate (mit dem Ende TGT) zu AGT modifiziert (gemaB der Sequenz vom Genotyp 3 
= Won *\N& nach Kolykhalov et al., 1996, J. Virol. 70, 3363) und auBerdem wurde ein zusatzlicher NuWeotidaustausch 

55 an Position 9562 vorgenommen, urn die A:T Basenpaarung in der Haarnadelstruktur am 3' Ende der 3' NTR (Kolyhalov 
et al. ibid.) beizubehalten. Urn eine interne Restriktionsstelle fQr das Enzym Scat zu beseitigen, wurde ferner ein sog. 
stiller ("silent") NuWeotidaustausch vorgenommen. Nach dem Zusammenf Ogen des Voliangen-Genoms mit passenden 
5'- und 3' NTRen wurde die komplette HCV-Sequenz OberprCrfL Dabei wurde kein ungewunschter NuWeotidaustausch 
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gefunden. 

[0055] Das auf diese Weise hergestellte HCV-Genom sollte per Definition hepatotrop sein. 



(B) Synthase selektierbarer HCV-Subqenom-Konstrukte 



5 



[0056] Unter Verwendung des urrter (A) beschriebenen Konsensusg enoms wurden HCV-Subgenom-Kbnstrukte 
hergestelft die das Arrtibiotikumresistenzgen Neomycin-Phosphotransferase (NPT) und zwei Sequenzen von irrternen 
Ribosomenbindungsstellen (IRES) errthalten. Die hierfur angewendeten biochemischen Verfahrenstechniken sind dem 
Fachmann bekannt und geidufig (siehe: Sambrook. J.. E.F. Fritsch, T. Maniatis, 1989, Molecularcloning: a laboratory 

10 manual. 2nd ed., Cold Spring Harbour Laboratory, Cold Spring Harbor, N.Y.; Ausubel et al. (eds.), 1994, Current Proto- 
cols in Molecular Biology, Vol. 1 -3, John Wiley & Sons Inc., New >brk). Das Antibiotikumresistenzgen wurde unmittelbar 
hinter der 5' NTR insertiert, wodurch eine bicistronische RNA erhalten wurde (siehe Rg. 1 A). Ebensogut kann das Anti- 
biotikumresistenzgen aber auch an anderer Stelle des HCV-Subgenom-Konstrukts insertiert werden, beispielsweise 
innerhalb der for das Polyprotein kodierenden Nukieotidsequenz, wodurch eine monocistronische RNA erhalten wind 

is (siehe Rg. 5 A) Oder in die 3' NTR (siehe Rg. 5 B). Bei den IRES-Elemerrten handeit es sich zum einen urn eine der 
beiden HCV-IRES-Variartten NuWeotide 1 -377 Oder NuWeotide 1 -339, und zum anderen urn die IRES des Enzephalo- 
myocarditis Virus, die die Translation der HCV Sequenz strangabwarts von den Genen fQr NS2 Oder NS3 bis zu dem 
authentischen 3' Ende des Genoms steuert. 

[0057] Die beiden genannten HCV-IRES-Varianten wurden wie folgt ermittert: Auf der Basis von Deletionsanalysen 

20 der 3' Grenze der HCV-IRES (Reynolds et al. 1995, EMBO J. 14, 6010) wurden verschiedene Abschnitte der 5' NTR 
mit dem NPT Gen fusioniert und anhand von Kotransfektionen mit einem das T7 RNA Polymerase Gen enthaltenden 
Plasmid hinsichtiich der maximalen Anzahl gebildeter Kolonien analysiert. Die besten Ergebnisse wurden mit den HCV 
Sequenzen von 1 -377 und 1 -389 erhalten. Da sich das AUG-Startkodon des HCV Polyproteins an Position 342 befindet 
und somit in der IRES-Sequenz errthalten ist, kommt es zu einer Fusion von 12 bzw. 16 Aminosauren des HCV-Kap- 

25 sidproteins ("Core-Proteins") mit der Neomycin Phosphotransferase (siehe Rg. 1 A). 

[0058] Diese modif izierten HCV-Subgenom-Kbnstrukte erhielten dementsprechend die Bezeichnungen I 377 /NS2- 
3' (Oder \ Z77 /U§3-3') und l 389 /NS2-3' (oder I388/NS3-3*). Sie sind in Rg. 1 A schematised dargesteilt. 
[0059] Mit in-vftro-Transkripten dieser modifizierten parentalen HCV-Subgenom-Konstrukte l 377 /NS2-3' (Oder 
I377/NS3-3 1 ) und l 389 /NS2-3' (oder I389/NS3-3*) wurden verschiedene Zellinien und Primarzellkurturen von menschli- 

30 chen Hepatocyten transfiziert 

[0060] Als parallele Negativ-Kbntrolle zu alien Transfektionsexperimerrten wurde zu jedem modifizierten parentalen 
HCV-Subgenom-Kbnstrukt ein entsprechend modifiziertes aber defektes Subgenom konstruiert, das sich von dem par- 
entalen dadurch unterscheidet, da(3 es innerhalb des Leserasters eine Deletion von 10 Aminosauren aufweist, die das 
aktive Zentrum der NS5B RNA Polymerase umfaBt (Behrens et al., 1996, EMBO J. 15, 12; und Lohmann et al., 1997, 

35 J. Virol. 71, 8416). 

(C\ Svnthese selektierba rer HCV-Genom-Konstrukte 

[0061 ] Ein NS2-3' Subgenomkonstrukt, das am 5* Ende mit einem Fragment des Luziferasegens und der vollstan- 
40 digen EMCV-IRES verbunden ist, wurde mitNcol und Spel restringiert und mittels prfiparativer Agarosegelelektropho- 
rese gereinigt Der so erhaltene Vektor wurde in einer 3-Faktor Ligation mit einem Ncol/Notl-HCV-Fragment, 
entsprechend den NuWeotidpositionen 342 bis 1968 des HCV-Genoms und mit einem Notl/Spel-Fragment, entspre- 
chend den NuWeotidpositionen 1968-9605 ligiert. Das entstandene Konstrukt, bei dem das vollstandige HCV-Leser- 
aster und die 3* NTR stromabwarts dem Luziferasegenfragment und der EMCV-IRES liegen, wurde danach mit Pmel 
45 und Spel restringiert und mit dem analog restringierten Ig^SS-S'/wt-Subgenomkonstrukt-V^tor ligiert Dieses selek- 
tionierbare HCV-Genomkonstrukt ist in Rg. 4 dargesteilt. 

(D) Herstelluno von den HCV-RNA-Ko nstrukten entsorechenden in-vitro-Trnaskripten 

so [0062] Die vorstehend beschriebenen gereinigten Plasmid DNAs wurden mit Seal linearisiert und nach Phe- 
nol/Chlorofbrm-Extraktion und Isopropanol-Prazipitation in eine In-vitro-Trankriptionsreaktion eingesetzt unter Verwen- 
dung der folgenden Komponenten: 80 mM HEPES, pH 7.5, 12,5 mM MgCI 2 . 2 mM Spermidin, 40 mM Dithiothreitol, 2 
mM von jedem NTP, 1 Einheit RNasin/jJ, 50 ng/ml restringierte DNA und ca. 2 Einheiten/jil T7 RNA Polymerase. Nach 
2 Std. bei 37°C wurde die HSIfte der Menge an T7 Polymerase zugegeben und der Reaktionsansatz weitere 2h inku- 

55 biert. Zur Entfernung von DNA wurde die Mischung mit saurem Phenol extrahiert (U. KedziersW, J.C. Porte, 1991 , Bio 
Techniques 10, 210), mit Isopropanol prdztprtiert das Pellet in Wasser gelGst und mit DNase (2 Einheiten pro ng DNA) 
fOr 60 Min. bei 37°C inkubiert Nach anschlieBender Extraktion mit saurem Phenol, saurem Phenol/Chloroform und 
Chloroform und Isopropanol- PrSzipitation wurde die gelOste RNA mittel optischer Dichtemessungen quantifiziert und 
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ihre Unversehrtheit mittels Formaldehyd-Agarose-Gelelektrophorese uberprQft 
Beispiel 2 : Transfektionsexperimente mit der Hepatomazellinie Huh-7 

5 [0063] Bei samtlichen Transfektionsexperimenten wurde sorgfaitig darauf geachtet, daB jegliche Matrizen-DNA 
zuvor entfernt worden war, urn zu vermeiden, daS solche DNA in transf izierte Zellen integrieren und diesen unabhangig 
von einer HCV-Replikation eine Neomycin-Resistenz vermitteln konnte. Deshalb wurde im AnschluB an die in-vitro- 
Transkription ( Beispiel 1 D) die Reaktionsmischung mit 2 Einheiten DNase pro fig DNA fur 60 Min. bei 37°C behandelt 
und mit saurem Phenol, saurem Phenol/Chloroform und Chloroform extrahiert. Vor der Verwendung fur die Transfektion 

10 wurde die pr&zipitierte RNA mittels Formaldehyd Agarose Gel Elektrophorese analysiert. 

[0064] Es wurden drei separate Transfektionsxperimente mit der hoch drfferenzierten humanen Hepatomazellinie 
Huh-7 (gemfife Nakabayashi et al. 1982, Cancer Res. 42, 3858) durchgefQhrt. Dabei wurde jeweils 15 \iq RNA in 8 x 
10 6 Huh-7-ZelIen mit Hirfe der Elektroporation eingebracht und diese Zellen anschlieBend in Kulturschalen von 10 cm 
Durchmesser ausgesat. 24 Stunden nach der Aussaat wurde Neomycin (= G418) in einer Endkonzentration von 1 

is mg/ml zugegeben. Das Kulturmedium wurde zweimal pro Woche gewechselt. Nach 3 ■ 5 Wochen waren Weine Kolo- 
nien erkennbar, die isoliert und unter den gleichen Kulturbedingungen passagiert wurden. 

[0065] Die Zeilklone, die im Verlauf des ersten Experiments erhahen wurden, wurden isoliert und subpassagiert. 
Wahrend dieser Prozedur starben die meisten Klone und die Endausbeute betrug nur noch 9 Klone von Zellen, die mit 
den parentalen HCV-Subgenom-Konstrukten transf iziert worden waren und 1 Klon (Klone 8-1) von Zellen, die mit 
20 einem defekten HCV-Genom-Konstrukt, namlich einer defekten NS2-3* HCV-RNA transfiziert worden waren. AuBer 
einer verkQrzten Verdopplungszeit und dem gelegentlichen Auftreten von irregular geformten Zellen wurden keine 
bestandigen morphologischen Unterschiede zwischen diesen 9 ZellWonen und dem einen ZellWon (Klon 8-1) Oder den 
parentalen Huh-7 Zellen gefunden. 

[0066] Die Hauptkriterien fur f unktionierende HCV-Genomkonstrukte sind die Bildung von viraler RNA mit korrekter 
25 GrOBe und die Abwesenheit von (integrierter) Plasmid DNA, die eine G418-Resistenz Qbertragen bzw. vermitteln 
k6nnte. 

[0067] Urn die HCV-RNA in den Huh-7-Zellen zu bestimmen, wurde die Gesamt-RNA isoliert und mittels des gan- 
gigen Northern-Blot Verfahrens unter Verwendung einer Plusstrang-spezrfischen Ribosonde (= RNA-Sonde) analy- 
siert. Hierfur wurde von den jeweiligen ZellWonen Gesamt-RNA nach der Methode von Chomczynski und Sacchi 1987, 

30 Anal. Biochem. 162, 156 isoliert. und 10 ng RNA, was dem Gesamt-RNA-Gehalt von 0,5 - 1 x 10 s Zellen entspricht, 
mittels denaturierender Formaldehyd-Agarose-Gelelektrophorese aufgetrennt (Spuren 3 bis 12 der Fig. 1 B). Als GrO- 
Benmarker mit authentischer Sequenz wurden gleichzeitig 1 0 9 in-vitro-Transkripte (Mr.), die zu den l 389 /NS2-3'/wt oder 
den l389/NS3-3'/wt Replikon-RNAs korrespondieren, mit aufgetrennt (Spur 1 bzw. Spur 2). Die aufgetrennte RNA wurde 
auf Nylon-Membranen transferiert und m'rt radioaktiv marWerter Plusstrang-spezifischer RNA-Sonde, die komplemen- 

35 tar zu dem kompletten NPT-Gen und der HCV-IRES von NuWeotid 377 bis NuWeotid 1 war, hybridisiert. Die Positionen 
der HCV-spezifischen RNAs (Pfeile) und der 28S rRNA sind rechts von Spur 12 angegeben, die GrOBen (Anzahlen der 
NuWeotide) der RNA-Marker sind links von Spur 1 angegeben. Die RNA Marker-Fragmente entharten HCV-Sequenzen 
und hybridisieren deshalb mit der Ribosonde (= RNA-Sonde). Die Ergebnisse dieser Analyse sind in Fig. 1 B darge- 
stelft 

40 [0068] Mit Ausnahme des mit dem defekten HCV-Genom-Kbnstrukt transfizierten Wons 8-1 , lieferten alle Zeilklone 
homogene HCV-RNAs korrekter Lange (ca. 8640 NuWeotide im Fall des NS2-3' und ca. 7970 NuWeotide im Fall des 
NS3-3' Replikons). Dieser Befund ist ein Indiz daf Qr, daB die funktionalen Replikons bzw. die f unktionalen HCV-Genom- 
KonstruWe die G418 Resistenz Qbertragen. Urn auszuschlieBen, daB die G418 Resistenz auf eine Plasmid-DNA 
zurOckzufuhren ist, die in das Genom der Huh-7 Wirtszelle integriert ist und unter der Kontrolle eines zelluldren Promo- 

45 tors transkribiert wird, wurde von jedem Won die DNA mittels einer NPT-Gen-spezrfischen PCR untersucht Hierbei 
wurde aus den selektierten Huh-7-ZellWonen die DNA mittels Verdau mit Proteinase K (40jig/ml, 1h, 37°C) in 
10mMTris, pH7,5, 1mM EDTA, 0,5% SDS und anschlieBender Extraktion mit Phenol, Phenol/Chloroform und Isopro- 
panolprazipitation isoliert. Das DNA-Praziphat wurde in 10 mM Tris (pH 7,5) und 1 mM EDTA gelOst und 1 Stunde mit 
Rnase A inkubiert. Im AnschluB an eine Phenol/Chloroform Extraktion und Ethanoi Prazipitation wurde 1 \ig DNA, errt- 

so sprechend 4 - 8 x 10 4 Zellen, mittels PCR unter Einsatz NPT-Gen-spezifischer Primer (S'-TCAAGACCGACCTG 
TCCGGTGCCC-3' und 5 , -CTTGAGCCTGGCGAACAGTTCGGC-3') analysiert und ein DNA-Fragment bestehend aus 
379 NuWeotiden erzeugt Die Spezrfitat des PCR-ProduWs wurde mittels Southern Blot Verfahren nachgewiesen, 
wobei ein Digoxigenin-marWertes DNA Fragment eingesetzt wurde, das zu dem NPT-Gen korrespondiert. Als Posrtiv- 
Kontrotlen (zum Nachweis etwa vorhandener kontaminierender NuWeinsauren) wurde das PCR- Verfahren mit 10 7 

55 Plasmid MoiekOlen Oder 1 fig DNA aus einer BHK Zellinie, die stabil mit einem Neomycin-Resistenz-Gen transfiziert 
war, durchgefQhrt und als Negativ-Kontrolle wurde die PCR mit denselben Reagenzien aber ohne zugesetzte DNA 
durchgefQhrt. 

Die Ergebnisse dieser Untersuchung sind in Fig. 1 C dargestelrt. Die Spuren 1 und 2 reprasentieren die Positiv-Kontrol- 
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I en, Spur 13 repraserrtiert die Negativ-Kontrdla Die Zahlenangaben links der Spur 1 bezeichnen die GrOBe der 
NuWeotid-Marker-MolekOIa AuBer In Won 7-3 (Rg. 1C, Spur 3), der von Zellen nach Transfektion mit einem NS2-3' 
Repnton/NS2-3WV-GenorrhKbnstrukt stammt. und in Won 8-1 (Fig. 1C. Spur 12), der von Zellen nach Transfektion 
mit einem defekten HCV-Genom-Konstrukt stammt war in keinem ZellHon eine NPT-DNA nachweisbar. Dieser Befund 

5 ist ein weiteres Indiz dafGr, daB die G418 Resistenz der meisten Klone durch die repiizierende HCV-RNA vermrttert 
wurde. Aber auch unabhangig von diesen Ergebnissen ist es unwahrscheinlich, daB HCV-RNAs mit korrekter GrOBe 
von integrierter Plasmld DNIA erzeugt wird, derm die fQr die in-vrtro-Transkription verwendeten Plasmide enthalten 
weder einen eukaryorrtischen Promotor noch ein Polyadenylierungssignal. Im Fall des Klons 7-3 ist die Resistenz des- 
halb hOchst wahrscheinfich sowohl durch das HCV-RNA-Konstrukt bzw. die repiizierende HCV-RNA als auch durch 

10 eine integrierte NPT DNA Sequenz vermittelt worden, wahrend die Resistenz der Zellen von Won 8-1 ausschlieBiich 
auf die integrierte Plasmid DNA zurOckzufflhren ist 

[0069] Urn zu bestatigen, daB die G41 8 Resistenz von einer autonom replizierenden HCV-RNA vermittelt ist wurde 
der Won 9-13 (Rg. 1 B, Spur 11) weiteren Tests unterworfen. Won 8-1, der integrierte Kbpien des NPT-Gens tragt. 
wurde QberaJI als Negativkontrolle eingesetzt. Mit dem Ziel, die Anwesenheit von NPT-DNA im Won 9-13 rigoros aus- 

15 zuschlieBen, wurde eine PCR durchgefOhrt, die den Nachweis von < 1000 NPT-Gen-Kopien in ~ 40.000 Zellen erlaubt. 
Das Ergebnis dieser PCR ist in Rg. 2A dargesteltt. Im einzelnen wurde bei dieser PCR wie folgt verfahren: 
Es wurden jeweils 10 6 - 10 2 Plasmid MolekOle (l377/NS3-3'/wt) entweder direkt (Spuren 7-11) oder nach Zugabe von 
jeweils 1 ng 9-1 3 DNA (Spuren 2 - 6) in dem Test eingesetzt Die Spezif rtat der ampfrf izierten DNA Fragment wurde rrtit- 
tels Southern Blot urrter Verwendung einer NPT-spezifischen Sonde bestimmt. Eine PCR ohne DNA-Sonde wurde als 

20 Negativ-Kbntrolle durchgef Qhrt (Spur 1 2) . 

Selbst mit dieser sensitiven Methode wurde in einem \lq DNA des ZellWons 9-13 keine Plasmid DNA gefunden (Spur 
1). Urn die Menge an HCV Plus- und Minusstrang RNAs in diesen Zellen abzuschatzen, wurde eine VerdOnnungsreihe 
von Gesamt-RNA mit dem Northern-Blot-Verfahren unter Verwendung einer Plus- oder Minusstrang-spezrfischen 
radioaktiv marWerten Ribosonde (= RNA-Sonde) analysiert Hierfur wurden jeweils 8, 4 oder 2 jig Gesamt-RNA, die 

25 aus den Zel IWonen 9-1 3 und 8-1 isoliert worden war en, parallel zu bekannten Mengen analoger in-vitro-Transkripte mit 
Plus- Oder Minusstrang-Polaritat (Kbntroll-RNAs) im Northern-Blot-Verfahren analysiert und anschlieBend einer Hybri- 
disierung unterworfen. Die Hybridisierung wurde mit einer Plusstrang-spezifischen Ribosonde, die das komplette NPT- 
Gen und die HCV-IRES abdeckte ('plusstrand'. obere Biidtafel). oder mit einer Minusstrang-spezifischen RNA-Sonde, 
die zu der NS3-Sequenz tomplementar war ('minusstrand', untere Biidtafel) durchgefuhrt. Die Pfeile markieren die 

30 Positionen von Replikon-RNA. Die Ergebnisse dieser Analyse sind in Rg. 2 B dargestellt. 

Im Fall des Plusstrangs wurden ca. 10 8 Kbpien/jig Gesamt-RNA nachgewiesen, was 1000 - 5000 HCV-RNA-Molekulen 
pro Zelle entspricht wahrend die Menge an Minusstrang-RNA 5- bis 10-fach niedriger war. Dieses Ergebnis stimmt mit 
der Annahme Gberein, daB die Minusstrang RNA die replikative Zwischenform bzw. Zwischenkopie ist, die als Vorlage 
for die Synthese der Plusstrang MolekOle dient. 

35 Da die Reaktion im wesentlichen von der viralen RNA-abhangigen RNA Polymerase katalysiert wird, sollte die Syn- 
these der HCV-RNAs resistent gegen Dactinomycin sein, einem Antibiotikum, das selektiv die RNA-Synthese von 
DNA-Matrizen inhibiert, nicht jedoch die RNA-Synthese von RNA-Matrizen. Urn diese Vermutung zu bestatigen, wur- 
den Zellen mit [ 3 H] Uridin in Anwesenheit von Dactinomycin inkubiert, die radioaktiv markierten RNAs extrahiert, mittels 
denaturierender Agarose-Gel-Elektrophorese aufgetrennt und mit Hitfe eines handelsubJichen Bio-lmagers unter Ver- 

40 wendung einer [ 3 H]-sensitiven Bildplatte analysiert. HierfOr wurden jeweils ca. 5 x 10 5 Zellen der Wone 9-13 und 8-1 
mit 100 ji Ci [ 3 H]Uridin for 16 Std. in Abwesenheit (-) Oder Gegenwart (+) von 4 ng/ml Dactinomycin (Dact) inkubiert. 
Im AnschluB an diese Markierungsreaktion wurde die Gesamt-RNA prapariert und mittels Formaldehyd-Agarose-Gel- 
Elektrophorese analysiert In den beiden ersten Spuren ist nur 1/10 der Gesamt-RNA dargestellt. Die radioaktiv mar- 
Werte RNA wurden mit einem BAS-2500 Bio-lmager (Rrma Fuji) sichtbar gemacht 

45 Die Ergebnisse dieser Analyse sind in Rg. 2 C dargestellt In Obereinstimmung mit dem Inhibitor-Proffl der NS5B Poly- 
merase (Behrens et al., 1996, EMBOJ. 15, 12 und Lohmann et at, 1997, J Virol. 71, 8416) war die Replikation der HCV 
RNA nicht durch Dactinomycin beeinfluBt worden, wahrend die Synthese von zelluiarer RNA gehemmt worden war. Urn 
die Iderrtitat der viralen RNA zu bestatigen, wurde eine RT-PCR zur ReWonierung der replizierten Sequenzen durchge- 
fOhrt. Die Sequenzanalyse der reWonierten RNA zeigte, daB die RNA in dem Won 9-13 HCV-spezifisch ist und mit dem 

so transfizierten Transkript des HCV-Konstrukts \ 377 /US3-3'/vA ubereinstimmt 

[0070] Zur Analyse der viralen Proteine wurden die betreffenden Zellen zunachst metabolisch mit [ 35 S] Methio- 
nin/Cystein radioaktiv markiert, anschlieBend lysiert und danach die HCV-spezifischen Proteine mittels Immunoprazi- 
pitation aus den Zell-Lysaten isoliert. Die Ergebnisse dieser Analysen sind in Fig. 3 A dargestellt. Im einzelnen wurde 
dabei wie folgt verfahren: Zellen der ZellWone 9-13 (wt) und 8-1 (A) waren durch Behandlung for 16 Stunden mit einer 

55 dem Fachmann geiaufigen und im Handel erhaitlichen Protein-Markierungs-Mischung (z.B. NEN Life Science) metabo- 
lisch radioaktiv markiert worden. Mittels Immunoprazipitation (IP) unter nicht-denaturierenden Bedingungen (z.B. nach 
Bartenschlager et al., 1995, J. Virol 69, 7519) und unter Verwendung von drei verschiedenen Antiseren (3/4, 5A, 5B, 
gemaB Markierung am oberen Ende der Spuren 1 bis 12) waren die HCV-spezifischen Proteine vom Zell-Lysat abge- 
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trennt worden.. Die Immunokomplexe wurden mittels Tricine SDS-PAGE analysiert und mittels Autoradiographie sicht- 
bar gemacht. Urn authentische GrCBenmarker zu erhalten, wurde das homologe Replikonkonstrukt l 3 77/NS3-3Vwt einer 
transienten Expression mit dem Vaccinia Virus T7-Hybrid System in Huh-7 Zellen unterworfen. Die dabei erhaltenen 
Produkte waren als GrCBenmarker (Spuren 7 - 9) parallel zu den Zellen der Klone 9-13 und 8-1 behandert worden. 
5 Identifizierte HCV-Proteine sind am linken Rand von Spur 1 markiert, die Moiekulargewichte (in Kilodalton) sind am 
rechten Rand von Spur 9 angegeben. Es ist anzumerken, daB das verwendete NS3/4-spezifische Antiserum f3/4*) 
bevorzugt mit NS4A und NS4B reagiert was zu einer Unterreprasentation von NS3 f Qhrt. 

[0071] Alle viralen Antigene waren eindeutig nachweisbar und ihre apparenten Moiekulargewichte zeigten keine 
Abweichungen gegenQber denjenigen, die nach transienter Expression desselben bicistronischen HCV-RNA-Kon- 

w strukts in den ursprungiichen Huh-7 Zellen ermrttett wurden. Urn die subzelluiare Verteilung der viralen Antigene zu 
bestimmen, wurde eine Immunofluoreszenz-Nachweisreaktion urtter Einsatz von NS3- und NS5A-spezifischen Arrtise- 
ren durchgefQhrt (z.B. nach Bartenschlager et al., 1995, J. Virol 69, 7519). Hierfur wurden Zellen der Klone 9-13 (wt) 
und 8-1 (A) 24 Std. nach dem AussSen auf Deckgiasern mit Methanol/Azeton fixiert und mit polyWonalen NS3- Oder 
NS5A-spezifischen Antiseren inkubiert. Die gebundenen AntikOrper wurden mit einem kommerziell erhaitlichen FITC- 

is konjugierten Anti-Kaninchen- Antiserum sichtbar gemacht. Zur UnterdrOckung unspezif ischer Fluoreszenzsignale wur- 
den die Zellen mit dem Farbstoff 'Evans Blue' gegengefarbt 

[0072] Die Ergebnisse dieses Nachweistests sind in Fig. 3 B dargestellt Mit beiden Antiseren war eine starke Fluo- 
reszenz im Zytoplasma nachweisbar. Die NS5A-spezrfischen Antiseren fuhrten auBerdem zu einer schwachen Zell- 
kern-Fluoreszenz, was darauf hindeutet, daB zumindest Weine Mengen dieses Antigens auch zum Zellkern gelangen. 

20 Die generell dominierende Prasenz der viralen Antigene im Zytoplasma ist jedoch ein starkes Indiz dafur, daB die HCV- 
RNA Replikation im Zytoplasma stattfindet — so wie das bei den meisten RNA-Viren der Fall ist. 
[0073] Diese Ergebnisse beiegen War, daB mit dem hier beschriebenen Versuchsansatz der Aufbau eines Zellkul- 
tursystems fOr das HCV gelungen ist, dessen Eff izienz alles bisher bekannte urn GrOBenordnungen Qbersteigt und erst- 
maiig den Nachweis viraler NuWeinsSuren und Proteine mit konventionellen und bewahrten biochemischen Methoden 

25 erlaubt Erst diese Effizienz erlaubt uberhaupt detailierte Untersuchungen der HCV-Pathogenese, genetische Analysen 
verschiedener HCV-Funktionen und ein genaues Studium der WusVWirtszellwechselwirkungen, wodurch sich neue 
Ansatzpunkte fur die Entwicklung einer antiviralen Therapie definieren lassen. 

Beispiel 3 : Transfektion von Huh-7 Zellen mit HCV-Genomkonstrukten 

30 

[0074] Huh-7 Zellen werden wie in Beispiel 2 beschrieben transf iziert und selektioniert, wobei hier jedoch selektio- 
nierbare Konstrukte verwendet werden, die das vollstandige Vlrusgenom enthalten. Die erhaltenen ZellWone werden 
analog dem Beispiel 2 mittels PCR auf Abwesenhett von HCV-DNA untersucht und die produkrjve Replikation der HCV- 
RNA wird danach mittels Northern Blot, [ 3 H]Uridinmarkierung in Anwesenheit von Dactinomycin, Nachweis der viralen 

35 Proteine bzw. Antigene vorzugsweise mit Hilfe des Western Blots, der Immunoprazipitation oder der Immunf luoreszenz 
nachgewiesen. Im Gegensatz zu den im Beispiel 2 beschriebenen Ansdtzen lassen sich mit dem hier beschriebenen 
Konstrukt auBerdem vollstandige und sehr wahrscheinlich infektifee Viren erhalten, was bei den dort (in Beispiel 2) 
beschriebenen Subgenomkonstrukten nicht der Fall ist. Diese Viren, die in der Zelle und dem ZellkulturGberstand vor- 
handen sind, werden beispielsweise mittels Ultrazentrifugation, Immunpr&zip'rtation oder Failung mit Polyethylenglykoi 

40 konzentriert und alle exogenen, d.h. nicht im Viruspartikel eingebauten NuWeinsSuren werden mittels Inkubation mit 
NuWeasen (RNase, DNase, MikrococusnuWease) verdaut. Auf diese Weise lassen sich alle korrtaminierenden Nukle- 
insauren, die nicht im schutzenden Viruspartikel enthalten sind, entfernen. Die geschutzte virale RNA wird nach Inak- 
tivierung der NuWeasen, beispielsweise mittels Inkubation mit Proteinase K in einem SDS-haftigen Puffer durch 
Extraktion mit Phenol und Phenol/Chloroform isoliert und mittels Northern Blot oder RT-PCR unter Verwendung HCV- 

45 spezifischer Primer nachgewiesen. Auch in diesem Versuchsansatz ist die Kbmbination des beschriebenen HCV-Kon- 
sensusgenoms mit einem Selektionsmarker entscheidend fQr die effiziente Produktion von viraler RNA, viraiem Protein 
und damit von HCV-Partikeln. 

Beispiel 4 : Herstellung und Anwendung eines HCV-RNA Konstrukts, bei dem das Resistenzgen Ober ein Ribo- 
so zym bzw. eine Erkennungsstelle fQr ein Ribozym mit der HCV-Subgenom-Sequenz verbunden ist 

[0075] Es wird ein HCV-RNA-Kbnstrukt gemaB Beispiel 1 Oder Beispiel 3 hergestellt, bei dem ein Antibiotikumresi- 
stenzgen Ober ein Ribozym bzw. eine Erkennungsstelle fQr ein Ribozym mit der HCV-RNA-Sequenz verbunden ist. Sol- 
che Konstrukte sind in Fig. 7 schematised dargestellt. Huh-7 Zellen werden wie in Beispiel 2 beschrieben mit diesem 
55 HCV-RNA-Konstrukt transf iziert Nach der Transfektion in die Zellen erfblgt zunachst die Selektion mit dem entspre- 
chenden Antibiotikum. In den dabei erhaltenen ZellWonen wird das einfdonierte Ribozym aktiviert oder, im Fall eines 
Konstrukts, das eine Erkennungsstelle fQr ein Ribozym tragt, wird das Ribozym in die Zelle eingeschleust (z.B. mittels 
Transfektion eines Ribozymkonstrukts Oder Infektion mit einem viralen Expressionsvektor, in den das entsprechende 
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Ribozym eingesetzt wurde). In beiden Fallen wird durch cfie ribozymvermrttelte Spaltung das Resist enzgen von der 
HCV-RNA-Sequenz abgetrennt Das Ergebnis ist im FalJ des HCV-Genom-Konstrukts ein authentisches HCV-Genom 
ohne Resistenzgen, das zur Bildung authentischer irrfektiGser Viruspartikel befahigt ist Im Fail des HCV-Subgenom- 
Konstaikts entsteht ein HCV-RepIikon ohne Resistenzgea 



Beisoiel 5 : Kotransfektion eines HCV-RNA-Konstrukts mrt einem separaten LuzHerase-Transfektionskonstrukt 

[0076] Es wird ein HCV-RNA-Konstrukt gemaB Beispiel 1 (A) oder Beispiel 3 oder Beispiel 4 hergestellt Parallel 
dazu wird ein Transfektionskonstrukt hergestellt welches das Luziferasegen urrrfaBt wobei dieses Luziferasegen ver- 

10 m'rttels einer ersten NuWeoticfeequenz, die fOr eine HCV-Protease- (z.B. NS3-Protease-) Spattungsstelle kocfiert, mit 
einer zweiten NuWeoWsequenz, die fur ein anderes Protein oder einen Teil eines anderen Proteins kodiert, verbunden 
ist. HCV-RNA-Konstrukt und Transfektionskonstrukt werden in beiiebige Wirtszellen, vorzugsweise Hepatomazelien, 
insbesondere Huh-7-ZelIen, eingeschleust. Dies kann auf die in Beispiel 2 beschriebene Art und Weise geschehen. 
Das Produkt des modifizierten Luziferasegens ist ein Uiziferase-Fusionsprotein, in dem die Luziferase auf Grund der 

75 Fusion mit dem Fremdantei! inaktrv ist In transf izierten Zellen mit hoher HCV-Repiikation wird das Fusionsprotein, das 
ja eine Schnittstelle fQr eine HCV-Protease enthalt gespalten und darrrit die aktive Form der Luziferase freigesetzt, die 
sich durch luminometrische Messung bestimmen laGt Wird die Replikation des HCV-RNA-Konstrukts gehemmt wird 
das Fusionsprotein nicht gespaften und keine aktive Luziferase freigesetzt. Infolgedessen ist cfie quantitative Bestim- 
mung der Luziferase ein Ma B fQr die Replikation des HCV-Subgenom-Konstrukts. Anstelle des Luziferasegens kann 

20 ebensogut ein anderes Reportergen verwendet werden. das in analoger Weise modrfiziert ist so daB seine Expression 
von der Virusreplikation abhangt obwohl dieses Reportergen nicht Bestandteil des HCV-Subgenom-Konstrukts ist. Es 
kann auch ein zellulares Protein, welches durch die HCV-Proteine Oder NuWeinsaure inaktiviert Oder aktiviert wird, als 
sogenannter Surrogatmarker verwendet werden. In diesem Fall ist die Expression bzw. Aktivitat dieses Surrogatmark- 
ers ein MaB fur die Replikation der viralen DNA, 



Beispiel 6 : Herstellung von HCV-Subgenom- Konstrukten mit Integrierten Fremdgenen zur Verwendung als 
leberzellspezifische Gerrfahren fQr die Gentherapie 

[0077] Diese rekombinanten und selektionierbaren HCV-Subgenom-Kbnstrukte werden in trans-komplementie- 
30 rende Helferzeliinien transfiziert, d.h. in Zellinien, die induzierbar oder konstrtutiv die fehlenden Funktionen (beispiels- 
weise die Strukturproteine) exprirrtieren. Zellklone, die ein funktionelles HCV-Subgenom-Konstrukt enthalten, lassen 
sich durch errtsprechende Seiektion etabiieren. Die von der Wirtszelle exprimierten Vlrus-Strukturproteine eriauben die 
Bildung von Viruspartikel n, in die die RNA der HCV-Subgenom-Kbnstrukte eingeschleust wird. Das Ergebnis sind also 
virus-ahnliche Partkel. die ein erfindungsgemaBes HCV-Subgenom-Konstrukt einschlieBiich des einWonierten Fremd- 
35 gens enthalten und die dieses mittels Irrfektion auf andere Zellen Qbertragen kCnnen. Ein Beispiel fur ein solches Kon- 
strukt ist in Fig. 8 dargestellt Es besteht auch die MOglichkeit, das hier beschriebene erfindungsgemaBe HCV- 
Subgenom-Konstrukt mit integriertem Fremdgen direkt als Expressionsvektor einzusetzen. Dabei wird analog dem vor- 
genannten Verrahren vorgegangen, allerdings mit dem Unterschied, daB Zellinien transfiziert waden, die keine trans- 
komplementierenden Faktoren exprimieren. In diesem Fall dient das HCV-Konstrukt also lediglich als 
40 Expressionsvektor. 

Beispiel 7 : Herstellung zeJIkuttur-adaptierter HCV-RNA-Konstrukte 

(A) Isolationsverfahren 



[0078] FQr die Bestimmung adaptiver Mutationen und die Herstellung zellkuttur-adaptierter HCV-RNA-Konstrukte 
wurde wie folgt verfahren: Zellen wurden mit einem HCV-RNA-Konstrukt wie unter den Beispielen 1 und 2 beschrieben 
transfiziert und G418-resistente ZellWone hergestellt Zur Bestimmung der Replikationskompetenz (darunter wird in 
diesem Zusammenhang die Anzahl G418-resistenter ZellWone verstanden, die pro Mikrogramm transf izierter HCV- 

50 RNA bzw. HCV-RNA-Konstrukt erhaiten wird) wurde exemplarisch die Gesamt-RNA aus einem der ZellWone, genannt 
9-13 (Rg. 1B, Spur 11) isoliert und die Menge der darin enthartenen HCV-RNA mittels Northern-blot wie in Fig. 2 B 
beschrieben bestimmt. 10 Mikrogramm der Gesamt-RNA, die ca. 10 9 MolekOle HCV-RNA enthielt, wurde anschlieBend 
per Elektroporation in naTve Huh-7 Zellen eingeschleust (Fig. 9). Parallel dazu wurden 10 9 in vitro Transkripte der ana- 
logen neo-HCV-RNA, die mit isolierter Gesamt-RNA aus naTven Huh-7 Zellen auf eine Gesamt-RNA-Menge von 10 ug 

55 aufgefQIrt worden war, in naive Huh-7 Zellen transfiziert. Nach Seiektion mit G418 wurde die Anzahl der Zellkolonien, 
ausgedruckt in 'colony forming units (cfu) pro Mikrogramm RNA' in den beiden Ansatzen bestimmt. Bei einer Konzen- 
tration von 500 ug/ml G418 im Selektioramedium betrug die Zah! der Kblonien, die mit der in der Isolierten Gesamt- 
RNA enthaitenen HCV-RNA erhaiten wurde, ca 100.000 cfu pro Mikrogramm HCV-RNA. Dagegen wurden mrtdersel- 
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ben Menge in vitro transkribierter HCV-RNA nur 30 - 50 Kblonien erhalten. Dieses Ergebnis belegt, daB die spezifische 
Infektiositat der HCV-RNA, die aus den Zellklonen isoliert wurde, ca. 1 .000 - 10.000-fach hOher ist ais die Infektiositat 
der analogen in vitro Transkripte. Das methodische Vorgehen ist in Rg. 9 dargestellt. 

[0079] Mit Hilfe der long-distance RT-PCR' wurde die HCV-RNA aus der Gesamt-RNA der 9-1 3 Zellen amplif iziert, 
5 die PCR-Amplif ikate Woniert und zahlreiche Klone sequenziert. Ein Vergleich der Sequenzen dieser reklonierten RNAs 
mit der Sequenz der RNA, die ursprunglich in die naiiven Huh-7 Zellen eingeschleust wurde ergab, daB die reklonierten 
RNAs zahlreiche Aminosaureaustausche besaBen, die utoer die gesamte HCV-Sequenz verteitt waren (Fig. 10). SfVI- 
Fragmerrte dieser reklonierten Mutanten wurden im Austausch gegen das analogs Stfl-Fragment des ursprOnglichen 
Replikonkonstrukts in dieses eingefOhrt und RNAs der jeweiligen Mutanten wurden in naive Huh-7 Zellen einge- 
10 schleust. Nach Selektion mit G41 8 wurde dann fur jede HCV-RNA-Mutante die Zahl der gebildeten Kolonien bestimmt. 
Wahrend mit der Ausgangs-RNA nur 30 - 50 Kblonien pro Mikrogramm RNA erhalten wurde war die Koloniezahl bei 
zwei der reklonierten Variarrten deutlich hOher (Fig. 10). Im Fall der HCV-RNA-Kbnstrukte 9-131 und 9-1 3C betrug die 
spezifische Infektiositat 100 - 1.000 cfu pro Mikrogramm RNA und beim 9-1 3F Repiikon sogar 1.000 - 10.000 cfu pro 
Mikrogramm RNA. Diese Ergebnisse zeigen, daB die Aminosaureaustausche in dem analysierten NS3-5B-Bereich der 
is Mutanten 9-131, 9-13C und insbesondere 9-13F zu einer deutlichen ErhOhung der Replikationskompetenz fuhrten. 
DemgegenGber waren alle anderen HCV-RNA-Konstrukte (9-13 A, B, G, H und K) nicht mehr replikationskompetent, 
enthielten also letale Mutationen. 

[0080] Zwecks Beantwortung der Frage, welche der Aminosaureaustausche im 9-13F-Kbnstrukt zur Steigerung 
der Replikation fOhrten, wurden die Austausche einzeln Oder in Kombination in das Ausgangs-HCV-RNA-Konstrukt ein- 

20 gefuhrt und die entsprechenden RNAs in naive Huh-7 Zeiien eingeschleust. Das Ergebnis der Transfektionen mit die- 
sen RNAs ist in Tabelle 1 zusammengefaBt. Daraus wird ersichtlich, daB im vorliegenden Beispiel die hohe 
Replikationskompetenz durch mehrere Mutationen bedingt ist. Den grOBten Beitrag leisten die Aminosaureaustausche 
in den HCV-RNA-Abschnitten NS5A und NS4B. Auch die einzelnen Austausche in der NS3-Region leisten einen Bei- 
trag, der mOglicherweise auf einem Synergismus dieser Einzelaustausche beruht 

25 Diese Befunde belegen, daB es durch die G418-Selektion der Zellen, die mit den neo-HCV-RNA-Konstrukten transfi- 
ziert wurden, zur Anreicherung solcher HCV-RNAs kam, die eine deutlich hGhere Replikationskompetenz hatten. Mit 
dem hier beschriebenen Versuchsansatz lassen sich HCV-RNA-Konstrukte mit sehr unterschiedlicher Replikationseffi- 
zienz selektionieren. Je hOher die Konzentration des Antibiotikums in dem Seiektionsmedium ist, irVauf dem die HCV- 
RNA-Kbnstrukt-haltigen Zellen zwecks Selektion kultiviert werden, desto hOher muB der Grad an adaptiven Mutationen 

30 und damit die Replikationseffizienz in den betreffenden HCV-RNA-Konstrukten sein, damit die Zellen auswachsen kOn- 
nen. Werden die Selektionen mit niedrigeren Antibiotikum-Kbnzentrationen durchgefuhrt, kOnnen auch solche Zellen 
Qberleben und sich vermehren, die im Vergleich geringer adaptive Mutationen und eine weniger hohe Replikationseffi- 
zienz aufweisen. 

Das bisher beschriebene HCV-RNA-Konstrukt 9-1 3F, das mehrere adaptive Mutationen enthielt, hatte eine erwiesener- 

35 maBen hOhere Replikationseffizienz als die parentale HCV-RNA. Urn HCV-RNAs mit noch hOherer Replikation in Zell- 
kultur zu erhalten, wurde die HCV-RNA, die in der Gesamt-RNA eines ausgewahlten ZellWons enthalten war, mehrfach 
in nalven Huh-7 Zellen passagiert. Dieser ausgewahite ZellWon, genannt 5-15, wurde durch Transfektion mit dem HCV- 
RNA-Konstrukt I389/NS3-3' erhalten (Fig. 1). Er entspricht weitgehend dem ZellWon 9-13, der durch Transfektion mit 
einem HCV-RNA-Konstrukt hergestellt wurde, das eine urn 22 NuWeotide kurzere HCV-IRES besaB (I377/NS3-3 1 ; Rg. 

40 1). 10 Mikrogramm Gesamt-RNA, isoliert aus dem ZellWon 5-15, wurden mittels Elektroporation in naiive Huh-7 Zellen 
eingeschleust und die Zellen einer Selektion m'rt 1 mg/ml G418 unterzogen. Aus einem der so erzeugten ZellWone 
wurde wiederum Gesamt-RNA isoliert, in naTve Huh-7 Zellen transfiziert und analog selektioniert. Dieser Vorgang 
wurde insgesamt viermal wiederholt. Nach der vierten Passage wurde aus einem ZellWon die Gesamt-RNA isoliert und 
die neo-HCV-RNA mit Hilfe der long-distance RT-PCR' amplifiziert. Das amplifizierte DNA-Fragment wurde mit dem 

45 Restriktionsenzym Sf il verdaut und in das Sfil-restringierte Ausgangskonstrukt I3S9/NS3-3' inseriert. Insgesamt wurden 
uber 1 00 DNA-Klone erhalten und zunachst mittels Restriktionsverdau analysiert In vitro transkribierte RNA von ca. 80 
dieser Klone wurde jeweils in naive Huh-7 eingeschleust und einer Selektion mit 500mg/ml G418 unterzogen. Von den 
80 untersuchten neo-HCV-RNA-Varianten erwiesen sich die allermeisten als replikationsdefekt. Bei zwei Mutanten, 
genannt 5.1 und 19, war die spezifische Infektiositat, ausgedrOckt als 'colony forming units' pro Mikrogramm RNA, 

so jedoch sehr deutlich erhoht (Tabelle 2). Durch mehrfache Passage der RNA in Zellkultur lassen sich offensichtlich HCV- 
RNAs herstellen, deren Replikationseffizienz aufgrund von Mutationen (sog. "adaptiven Mutationen) mehrere GrOBen- 
ordnungen hOher ist als die der ursprQnglich aus dem Patienten Wonierten RNA. 

(B) Modrf ikationsverfahren 

55 

[0081] Solche nach (A) erzeugtenn und identifizierten adaptiven Mutationen kOnnen in ein wenig replikationskom- 
petentes HCV-RNA-Konstrukt ubertragen werden und fuhren zu einer massiven Steigerung der Replikation dieses 
Konstrukts. Diese Steigerung ist so hoch, daB damit nachweislich HCV-RNAs in Zellkultur zur Replikation gebracht 
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werden kfinnen, die kein selektierbares Markergen mehr besitzen. Rg. 12 zeigt einen Vergjeich der Replikationseffizi- 
enz von HCV-RNAs, die entweder der Ausgangssequenz oder den adaptierten Sequenzen 9-1 3F bzw. 5.1 entspra- 
chen. Zwecks einfacher Messung wurde das neo-Gen errtfernt und durch das Gen for die Luziferase ersetzi Als 
Negativtontrofle diente wiederum ein HCV-RNA-Konstrukt, das auf Grund einer inaktivierenden Mutation der NS5B 

5 RNA-Polymerase replikationsdefekt war. Schon 24 Stunden nach der Transfektion erkennt man einen deutiichen Unter- 
schied in der Luziferaseaktivrtat zwischen der defekten RNA und den 9-13F bzw. 5.1-Konstrukten wahrend zwischen 
der defekten RNA (318 ON) und dem Ausgangs-RNA-Konstrukt (wt) das keine adaptiven Mutationen besaS, kaum ein 
Unterschied zu sehen war. Wahrend des gesamten Beobachtungszertraums wurde die hOchste Luzrferaseaktivitat und 
damit die hOchste Replikation mrt der 5.1 -RNA erhalten. Diese Befunde beiegen nicht nur die hohe Replikationseffizi- 

10 enz cfieser RNA, sondern zeigen auch, daB es mOglich ist, rrdt adaptierten HCV-RNA-Kbnstrukten ein Zelikultursystem 
aufzubauen, fur das die Anwesenheit eines selektierbaren Gens nicht mehr notwendig ist. Eine zusammentassende 
Obersicht der NuWeotid- und Aminosaureurrterschiede zwischen dem Ausgangskonstrukt und den Mutanten 9-1 3F, 5.1 
und 19 ist in Tabelle 3 gegeben. 

75 Belsplel 8: Herstellung zeJIkuttur-adaptierter HCV-RNA- Voliangengenome 

[0082] In den Beispielen 1 bis 7 wurde stets eine subgenomische HCV-RNA verwendet, der die gesamte Struktur- 
proteinregion von Core bis einschlieBlich p7 bzw. NS2 fehfte. Im vorliegenden Beispiel 8 wird gezeigt, daB es mdglich 
ist, mit Hilfe der adaptierten NS3-5B-Sequenz ein HCV-Voliangengenom in Zellkultur zur Replikation zu bringen. Zu 
20 diesem Zweck wurde zundchst das Sfil-Fragment der gerr&B Beispiel 7 hergestelften, hoch adaptierten HCV-RNA 5.1 
in ein selektionierbares HCV-Voliangengenom transferiert (Rg. 12). Dieses HCV-Genom wurde in naTve Huh-7 Zellen 
transfiziert und einer Selektion mit unterschiedlichen G418-Kbnzentrationen unterzogen. In Abhangigkeit von der 
Selektionsstarke (der G418-Konzerrtration) wurde eine unterschiedlich groBe Zahl an ZellWonen erhalten (Rg. 12 B) . 
Im Vergleich dazu wurden mit dem unveranderten HCV-Voliangengenom, das keine-adaptiven Mutationen enthielt, 
25 keine Kolonien erhalten, ebenso mit der Negativkontrolle, die auf Grund einer inaktivierenden Mutation in der NS5B 
RNA-Polymerase replikationsdefekt war. Zum Nachweis daf Qr t daB die so entstandenen ZellWone tatsdchlich ein auto- 
nom replizierendes HCV-Voilangenkonstrukt enthielten, wurde Gesamt-RNA aus mehreren ZellWonen "tsoliert und mit- 
tels Northern-Blot analysiert. In alien ZellWonen war die Voliangen HCV-RNA eindeutig nachweisbar (Rg. 1 2). Damit ist 
eindeutig belegt, daB es mit Hilfe der an Zeilkutturen adaptierten HCV-Sequenzen mOglich ist, ein HCV-Voliangenge- 
30 nom herzusteilen, das mit hoher Effizienz und autonom in einer Zellinie repliziert, d.h. es kdnnen mit dem erf indungs- 
gemdBen System auch adaptierte HCV-Voliangengenome hergestellt werden. Da dieser Klon daruber hinaus die 
voilstandige HCV-Sequenz besitzt also auch die fur die Viruspartikelbildung notwendigen Strukturproteine, ist es mit 
diesem System mdglich, groBe Mengen infektiGser Viruspartikel in Zellkufturen herzusteilen. Zum Nachweis dieser 
Wen werden zellfreie Oberstande von Zellen, die ein replizierendes HCV-Voliangengenom tragen, auf naive Huh-7 Zei- 
ss len gegeben und die so infizierten Zellen einer Selektion mit G41 8 unterzogen. Jeder ZellWon, der unter diesen Bedin- 
gungen auswdchst, geht auf eine infizierte Zelle zurOck. Die Viren in den ZellkulturQberstanden von Zellen, die ein 
replizierendes HCV-Voliangengenom besitzen, kOnnen aber auch mit verschiedenen im Stand der Technik bekannten 
Verfahren wie Ultrazentrifugation Oder Mikrodiaiyse angereichert und gereinigt werden und dann zur Infektion naiver 
Zellen verwendet werden. Mit diesem Verfahren ist eindeutig gezeigt, daB mit dem erfindungsgemaBen HCV-Zeiikultur- 
40 system zellkuitur-adaptierte HCV-Voliangengenome hergestellt werden kdnnen, die mit hoher Effizienz in Zellen repli- 
zieren und infektiOse Viren produzieren. Diese kOnnen ebenfalls durch Infektion eines Versuchstiers. vorzugsweise 
dem Schimpansen, nachgewiesen werden. 

Beispiel 9: Herstellung von HCV-Voliangen-Konstrukten und HCV-Subgenom-Konstrukten mit Reportergen. 

45 

[0083] Es wird ein HCV-RNA-Konstrukt hergestellt, bei dem anstelle des Antibiotikumresistenzgens ein Reporter- 
gen eingefugt wird (Rg. 13). Dabei kann die Replikation anhand der Menge bzw. der Aktivitat des Reportergens bzw. 
Reportergenprodukts bestimmt werden. Das Reportergen ist vorzugsweise ein Gen aus der Gruppe der Luzrferase- 
gene, dem CAT-Gen (Chloramphenicol-Acetyl-Transferase-Gen), dem lacZ-Gen (beta-Galaktosidasegen), dem GFP- 

50 Gen (green fluorescence protein Gen), dem GUS-Gen (Glukuronidasegen) oder dem SEAP-Gen (sezernierte alkali- 
sche Phosphatasegen). Diese Reportergene bzw. deren Produkte, namlich die entsprechenden Reporterproteine, kOn- 
nen z.B. mittels Ruoreszenz, Chemilumineszenz, colorimetrisch oder mit Hilfe immunologischer Methoden (z.B. 
enzyme-linked immunosorbent assay, ELISA) bestimmt werden. Das Reportergen kann entweder von einer eigenen 
IRES exprimiert werden oder in Form eines Fusionsproteins, das entweder als solches aktiv ist oder mittels einer pro- 

55 tedytisch spahbaren Aminosauresequenz so mit einem HCV-Protein verbunden ist, daB es von einer zelluiaren oder 
viral en (HCV-)Protease von diesem abgespalten wird. 
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BelspieMO : Herstellung von HCV-Voliangen-Konstrukten mh Integrierten Fremdgenen zur Verwendung als 
leberzellspezrf ische Genfdhre fur die Gentherapie Oder als Expressionsvektor A 

[0084] Das Konstrukt (Fig. 14) wind in Zellen eingeschleust und fOhrt dort zur Bildung von HCV-Viruspartikeln, die 
zur Inlektion weiterer Zellen verwendet werden kfinnen. Da die Viruspartikel eine RNA mit einem Fremdgen enkapsi- 
diert haben kann dieses in den so infizierten Zellen zur Produktion des von diesem Fremdgen kodierten Proteins 
benutzt werden. Zellen, die mit dem Konstrukt transf iziert wurden, exprimieren ebenfalls das Fremdgen. 

BeisplelH: Herstellung von monoclslronlschen HCV-RNA-Kbnstrukten, bei denen das Reslstenzgenprodukl 
als Fusionsprotein mit dem HCV-Anteil exprimiert wird. 

[0085] Fur bestimmte Untersuchungen ist es von Vorteil. wenn das HCV-RNA-Konstrukt kein heterologes IRES- 
Element besitzt Solche Untersuchungen sind beispielsweise die Bestimmung der Interferonresistenz. Wird eine Zelle, 
die ein HCV-RNA-Konstrukt besitzt, mit Interferon-alpha oder -beta inkubiert, kommt es zu einer Reduktion der Repli- 
kation der HCV-RNA. Zur AufWarung des Wirkungsmechanismus ist es notwendig, daB das HCV-RNA-Konstrukt keine 
heterologe IRES besitzt, da ansonsten nicht bestimmt werden kann, ob die Irterferon-vermrtterte Hemmung durch eine 
Hemmung der HCV-Replikation oder durch eine Hemmung der heterologen I RES vermittelt wird. Deshalb werden Kon- 
strukte hergestellt, bei denen das Resistenzgen mit einem HCV-Protein f usioniert wird (Fig. 1 5). Entweder das Fusions- 
protein ist als solches aktiv oder das Resistenzgenprodukt wird mittels einer proteolytisch spaltbaren 
Aminosauresequenz so mit einem HCV-Protein verbunden ist, daB es von einer zelluiaren oder viralen (HCV-)Protease 
von diesem abgespalten wird. 



Tabelle 1 



Spez'rfische Infektiositaten (cfu/jxg RNA) der HCV-RNA-Kbnstrukte mit adaptiven Mutationen, die bei der 9-1 3F 
Mutante gefunden und in das parentale HCV-RNA-Konstrukt l 38 9/NS3-3'/wt eingefuhrt wurden 


Aminosdureaustausch 1 


HCV-Protein 


cfu/jig RNA 2 


kein 




30-60 


1283 arg -> gly 


NS3 


200-250 


1383 glu -> ala 


NS3 


30-60 


1577 lys -> arg 


NS3 


30-60 


1609 lys -> glu 


NS3 


160-300 


(1 283 arg -> gly + 1 383 glu -> ala + 1577 lys -> arg + 1 609 lys - 
>glu) 


NS3 


360 - 420 


1936 pro -> ser 


NS4B 


500-1000 


2163 glu -> gly 


NS5A 


1000-5000 


2330 lys -> glu 


NS5A 


30-60 


2442 ile -> val 


NS5B 


30-60 


alle zusammen 




5000 



1 Aminosaureaustausch im Pdyprotein des HCV-lsolats Con-1 (EMBL-Genbank No. AJ238799); die Aminosauren sind im 
Dreibuchstabenkode angegeben. 

2 Colony forming units (Anzahl der ZelMone) bei einer Selektion von 500jig/ml G418. 
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Tabelle 2 



Spezifische Infektiositaten (cfu/ng RNA) des parenta- 
len HCV-RNA-Konstrukts l389/NS3-3'/wt und der Vari- 
anten 9-13C. 9-131. 9-13F, 5.1 und 19. 


Transfizierte RNA-Vkri- 
ante 


cfu/Mg RNA 1 


Witdtyp 


30-50 


9-13 C 


100-1.000 


9-13 I 


100-1.000 | 


9-13 F 


1.000-10.000 


5.1 


50.000-100.000 


19 


50.000-100.000 



1 Colony forming units (Anzahl der ZeiWone) bei einer 
Selektion von 500jxg/ml G418. 
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Tabdle3: Nuklcotid- und Aminosaureunterschiede zwischcn dem parentalen HCV- 
RNA-Konstrulct I 3 89/NS3-3Vwt und den Mutanten 9-131, 9-13F, 5.1 und 19 



HCV Mutante 


Nuklcotid Dosition 


Nuklcotidaustausch 


Aminosiareaostausc 
h 


9-131 


3685 


C>T 


Pro > Leu 




4933 


C>T 


Thr >Met 




5249 


T>C 






8486 


C>T 






8821 


G> A 


Trp > stop 




8991 


C>G 


Arg>G!y 




9203 


A>G 






9313 


T>C 


Phe > Ser 




9346 


T>C 


Val> Ala 


9-13 F 


3866 


C>T 






4188 


A>G 


Arg>Gly 




4489 


A>C 


Ghx> Ala 




4562 


G> A 






4983 


T>C 






5071 


A>G 


Lys > Arg 




5166 


A>G 


Lys > Glu 




6147 


C>T 


Pro > Ser 




6829 


A>G 


Glu > Gly 




7329 


A>G 


Lys > Glu 




7664 


A>G 


IlOVal 




8486 


C>T 






8991 


OG 


Arg > Gly 


NK5.1 


4180 


C>T 


Thr > He 




4679 


C>T 
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4682 


T>C 


• 




S610 


OA 


Leu>Ile 




6437 


A>G 


• 




6666 


A>G 


Asn> Asp 




6842 


C>T 






6926 


C>T 


** 




6930 


T>C 


Ser>Pro 




7320 


C>T 


Pro> Ser 




7389 


A> G 


Lys>Glu 


MK19 


3946 


A>G 


Glu>Gfy 




4078 


OG 


Ala>Gly 




4180 


C>T 


Thr>Ile 




4682 


T>C 


• 




5610 


C>A 


Leu > He 




5958 


A>T 


Met > Leu 




6170 


T> A 






6596 


G> A 






6598 


OG 


Ala>dy 




6833 


C>T 






6842 


C>T 






6930 


T>C 


Ser > Pro 




7141 


A> G 


Glu>Gly 




7320 


C>T 


Pro > Ser 




7389 


A>G 


Lys > Glu 




7735 


G> A 


Ser > Asa. 



[0086] Angegeben sind die Unterschiede der NuWeotkj- und Aminosduresequenzen zwischen der Ausgangs-HCV- 
RNA-Sequenz Con 1 (EMBL-Genbank No. AJ238799) und denen der zellkutturadaptierten HCV-RNAs. Die Zahlen 
beziehen sich auf die NuWeotid- und Aminosdurepositionen des HCV-lsolats Con1. 
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SEQUENCE LISTING 

s <110> Bartenschlager, Ralf 

<120> Hepatitis C Virus cell culture system 

<130> ba-1 

<140> 199 15 178.4 
10 <141> 1999-04-03 

<160> 11 

<170> Patentln Ver. 2.1 

<210> 1 
15 <211> 11076 

<212> DNA 

<213> Hepatitis C Virus 
<400> 1 

gccagccccc gattgggggc gacactccac catagatcac tcccctgtga ggaactactg 60 

20 tcttcacgca gaaagcgtct agccatggcg ttagtatgag tgtcgtgcag cctccaggac 120 

cccccctccc gggagagcca tagtggtctg cggaaccggt gagtacaccg gaattgccag 180 
gacgaccggg tcctttcttg gatcaacccg ctcaatgcct ggagatttgg gcgtgccccc 240 
gcgagactgc tagccgagta gtgttgggtc gcgaaaggcc ttgtggtact gcctgatagg 300 
gtgcttgcga gtgccccggg aggtctcgta gaccgtgcac catgagcacg aatcctaaac 360 
ctcaaagaaa aaccaaacgt aacaccaacg ggcgcgccat gattgaacaa gatggattgc 420 
acgcaggttc tccggccgct tgggtggaga ggctattcgg ctatgactgg gcacaacaga 480 

25 caatcggctg ctctgatgcc gccgtgttcc ggctgtcagc gcaggggcgc ccggttcttt 540 

ttgtcaagac cgacctgtcc ggtgccctga atgaactgca ggacgaggca gcgcggctat 600 
cgtggctggc cacgacgggc gttccttgcg cagctgtgct cgacgttgtc actgaagcgg 660 
gaagggactg gctgctattg ggcgaagtgc cggggcagga tctcctgtca tctcaccttg 720 
ctcctgccga gaaagtatcc atcatggctg atgcaatgcg gcggctgcat acgcttgatc 780 
cggctacctg cccattcgac caccaagcga aacatcgcat cgagcgagca cgtactcgga 840 
tggaagccgg tcttgtcgat caggatgatc tggacgaaga gcatcagggg ctcgcgccag 900 

30 ccgaactgtt cgccaggctc aaggcgcgca tgcccgacgg cgaggatctc gtcgtgaccc 960 

atggcgatgc ctgcttgccg aatatcatgg tggaaaatgg ccgcttttct ggattcatcg 1020 
actgtggccg gctgggtgtg gcggaccgct atcaggacat agcgttggct acccgtgata 1080 
ttgctgaaga gcttggcggc gaatgggctg accgcttcct cgtgctttac ggtatcgccg 1140 
ctcccgattc gcagcgcatc gccttctatc gccttcttga cgagttcttc tgagtttaaa 1200 
cagaccacaa cggtttccct ctagcgggat caattccgcc cctctccctc ccccccccct 1260 

35 aacgttactg gccgaagccg cttggaataa ggccggtgtg cgtttgtcta tatgttattt 1320 

tccaccatat tgccgtcttt tggcaatgtg agggcccgga aacctggccc tgtcttcttg 1380 
acgagcattc ctaggggtct ttcccctctc gccaaaggaa tgcaaggtct gttgaatgtc 1440 
gtgaaggaag cagttcctct ggaagcttct tgaagacaaa caacgtctgt agcgaccctt 1500 
tgcaggcagc ggaacccccc acctggcgac aggtgcctct gcggccaaaa gccacgtgta 1560 
taagatacac ctgcaaaggc ggcacaaccc cagtgccacg ttgtgagttg gatagttgtg 1620 
gaaagagtca aatggctctc ctcaagcgta ttcaacaagg ggctgaagga tgcccagaag 1680 

40 gtaccccatt gtatgggatc tgatctgggg cctcggtgca catgctttac atgtgtttag 1740 

tcgaggttaa aaaacgtcta ggccccccga accacgggga cgtggttttc ctttgaaaaa 1800 
cacgataata ccatgggcac gaatcctaaa cctcaaagaa aaaccaaacg taacaccaac 1860 
cgccgcccac aggacgtcaa gttcccgggc ggtggtcaga tcgtcggtgg agtttacctg 1920 
ttgccgcgca ggggccccag gttgggtgtg cgcgcgacta ggaagacttc cgagcggtcg 1980 
caacctcgtg gaaggcgaca acctatcccc aaggctcgcc agcccgaggg tagggcctgg 2040 

45 gctcagcccg ggtacccctg gcccctctat ggcaatgagg gcttggggtg ggcaggatgg 2100 

ctcctgtcac cccgtggctc tcggcctagt tggggcccca cggacccccg gcgtaggtcg 2160 
cgcaatttgg gtaaggtcat cgataccctc acgtgcggct tcgccgatct catggggtac 2220 
attccgctcg tcggcgcccc cctagggggc gctgccaggg ccctggcgca tggcgtccgg 2280 
gttctggagg acggcgtgaa ctatgcaaca gggaatctgc ccggttgctc cttttctatc 2340 
ttccttttgg ctttgctgtc ctgtttgacc atcccagctt ccgcttatga agtgcgcaac 2400 
gtatccggag tgtaccatgt cacgaacgac tgctccaacg caagcattgt gtatgaggca 2460 

SO gcggacatga tcatgcatac ccccgggtgc gtgccctgcg ttcgggagaa caactcctcc 2520 

cgctgctggg tagcgctcac tcccacgctc gcggccagga acgctagcgt ccccactacg 2580 
acgatacgac gccatgtcga tttgctcgtt ggggcggctg ctctctgctc cgctatgtac 2640 
gtgggagatc tctgcggatc tgttttcctc gtcgcccagc tgttcacctt ctcgcctcgc 2700 
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cggcacgaga cagtacagga ctgcaattgc tcaatatatc ccggccacgt gacaggtcac 2760 
cgtatggctt gggatatgat gatgaactgg tcacctacag cagccctagt ggtatcgcag 2820 
ttactccgga tcccacaagc tgtcgtggat atggtggcgg gggcccattg gggagtccta 2880 
gcgggccttg cctactaCtc catggtgggg aactgggcta aggttctgat tgtgatgcta 2940 
ctctttgccg gcgttgacgg gggaacctat gtgacagggg ggacgatggc caaaaacacc 3000 
ctcgggatta cgtccctctt ttcacccggg tcatcccaga aaatccagct tgtaaacacc 3060 
aacggcagct ggcacatcaa caggactgcc ctgaactgca atgactccct caacactggg 3120 
ttccttgctg cgctgttcta cgtgcacaag ttcaactcat ctggatgccc agagcgcatg 3180 
gccagctgca gccccatcga cgcgttcgct caggggtggg ggcccatcac ttacaatgag 3240 
tcacacagct cggaccagag gccttattgt tggcactacg caccccggcc gtgcggtatc 3300 

10 gtacccgcgg cgcaggtgtg tggtccagtg tactgcttca ccccaagccc tgtcgtggtg 3360 

gggacgaccg accggttcgg cgtccctacg tacagttggg gggagaatga gacggacgtg 3420 
ctgcttctta acaacacgcg gccgccgcaa ggcaactggt ttggctgtac atggatgaat 3480 
agcactgggt tcaccaagac gtgcgggggc cccccgtgta acatcggggg gatcggcaat 3540 
aaaaccttga cctgccccac ggactgcttc cggaagcacc ccgaggccac ttacaccaag 3600 
tgtggttcgg ggccttggtt gacacccaga tgcttggtcc actacccata caggctttgg 3660 
cactacccct gcactgtcaa ctttaccatc ttcaaggtta ggatgtacgt ggggggagtg 3720 
gagcacaggc tcgaagccgc atgcaattgg actcgaggag agcgttgtaa cctggaggac 3780 
agggacagat cagagcttag cccgctgctg ctgtctacaa cggagtggca ggtattgccc 3840 
tgttccttca ccaccctacc ggctctgtcc actggtttga tccatctcca tcagaacgtc 3900 
gtggacgtac aatacctgta cggtataggg tcggcggttg tctcctttgc aatcaaatgg 3960 
gagtatgtcc tgttgctctt ccttcttctg gcggacgcgc gcgtctgtgc ctgcttgtgg 4020 
atgatgctgc tgatagctca agctgaggcc gccctagaga acctggtggt cctcaacgcg 4080 

20 gcatccgtgg ccggggcgca tggcattctc tccttcctcg tgttcttctg tgctgcctgg 4140 

tacatcaagg gcaggctggt ccctggggcg gcatatgccc tctacggcgt atggccgcta 4200 
ctcctgctcc tgctggcgtt accaccacga gcatacgcca tggaccggga gatggcagca 4260 
tcgtgcggag gcgcggtttt cgtaggtctg atactcttga ccttgtcacc gcactataag 4320 
ctgttcctcg ctaggctcat atggtggtta caatatttta tcaccagggc cgaggcacac 4380 
ttgcaagtgt ggatcccccc cctcaacgtt cgggggggcc gcgatgccgt catcctcctc 4440 
acgtgcgcga tccacccaga gctaatcttt accatcacca aaatcttgct cgccatactc 4500 

25 ggtccactca tggtgctcca ggctggtata accaaagtgc cgtacttcgt gcgcgcacac 4560 

gggctcattc gtgcatgcat gctggtgcgg aaggttgctg ggggtcatta tgtccaaatg 4620 
gctctcatga agttggccgc actgacaggt acgtacgttt atgaccatct caccccactg 4680 
cgggactggg cccacgcggg cctacgagac cttgcggtgg cagttgagcc cgtcgtcttc 4740 
tctgatatgg agaccaaggt tatcacctgg ggggcagaca ccgcggcgtg tggggacatc 4800 
atcttgggcc tgcccgtctc cgcccgcagg gggagggaga tacatctggg accggcagac 4860 

30 agccttgaag ggcaggggtg gcgactcctc gcgcctatta cggcctactc ccaacagacg 4920 

cgaggcctac ttggctgcat catcactagc ctcacaggcc gggacaggaa ccaggtcgag 4980 
ggggaggtcc aagtggtctc caccgcaaca caatctttcc tggcgacctg cgtcaatggc 5040 
gtgtgttgga ctgtctatca tggtgccggc tcaaagaccc ttgccggccc aaagggccca 5100 
atcacccaaa tgtacaccaa tgtggaccag gacctcgtcg gctggcaagc gccccccggg 5160 
gcgcgttcct tgacaccatg cacctgcggc agctcggacc tttacttggt cacgaggcat 5220 
gccgatgtca ttccggtgcg ccggcggggc gacagcaggg ggagcctact ctcccccagg 5280 

35 cccgtctcct acttgaaggg ctcttcgggc ggtccactgc tctgcccctc ggggcacgct 5340 

gtgggcatct ttcgggctgc cgtgtgcacc cgaggggttg cgaaggcggt ggactttgta 5400 
cccgtcgagt ctatggaaac cactatgcgg tccccggtct tcacggacaa ctcgtcccct 5460 
ccggccgtac cgcagacatt ccaggtggcc catctacacg cccctactgg tagcggcaag 5520 
agcactaagg tgccggctgc gtatgcagcc caagggtata aggtgcttgt cctgaacccg 5580 
tccgtcgccg ccaccctagg tttcggggcg tatatgtcta aggcacatgg tatcgaccct 5640 

40 aacatcagaa ccggggtaag gaccatcacc acgggtgccc ccatcacgta ctccacctat 5700 

ggcaagtttc ttgccgacgg tggttgctct gggggcgcct atgacatcat aatatgtgat 5760 
gagtgccact caactgactc gaccactatc ctgggcatcg gcacagtcct ggaccaagcg 5820 
gagacggctg gagcgcgact cgtcgtgctc gccaccgcta cgcctccggg atcggtcacc 5880 
gtgccacatc caaacatcga ggaggtggct ctgtccagca ctggagaaat ccccttttat 5940 
ggcaaagcca tccccatcga gaccatcaag ggggggaggc acctcatttt ctgccattcc 6000 
aagaagaaat gtgatgagct cgccgcgaag ctgtccggcc tcggactcaa tgctgtagca 6060 

45 tattaccggg gccttgatgt atccgtcata ccaactagcg gagacgtcat tgtcgtagca 6120 

acggacgctc taatgacggg ctttaccggc gatttcgact cagtgatcga ctgcaaCaca 6180 
tgtgtcaccc agacagtcga cttcagcctg gacccgacct tcaccattga gacgacgacc 6240 
gtgccacaag acgcggtgtc acgctcgcag cggcgaggca ggactggtag gggcaggatg 6300 
ggcatttaca ggtttgtgac tccaggagaa cggccctcgg gcatgttcga ttcctcggtt 6360 
ctgtgcgagt gctatgacgc gggctgtgct tggtacgagc tcacgcccgc cgagacctca 6420 

So gttaggttgc gggcttacct aaacacacca gggttgcccg tctgccagga ccatctggag 6480 

ttctgggaga gcgtctttac aggcctcacc cacatagacg cccatttctt gtcccagact 6540 
aagcaggcag gagacaactt cccctacctg gtagcatacc aggctacggt gtgcgccagg 6600 
gctcaggctc cacctccatc gtgggaccaa atgtggaagt gtctcatacg gctaaagcct 6660 
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acgctgcacg ggccaacgcc cctgctgtat aggctgggag ccgttcaaaa cgaggttact 6720 
accacacacc ccataaccaa atacatcatg gcatgcatgt cggctgacct ggaggtcgtc 6780 
acgagcacct gggtgctggt aggcggagtc ctagcagctc tggccgcgta ttgcctgaca 6840 
acaggcagcg tggtcattgt gggcaggatc atcttgtccg gaaagccggc catcattccc 6900 
gacagggaag tcctttaccg ggagttcgat gagatggaag agtgcgcctc acacctccct 6960 
tacatcgaac agggaatgca gctcgccgaa caattcaaac agaaggcaat cgggttgctg 7020 
caaacagcca ccaagcaagc ggaggctgct gctcccgtgg tggaatccaa gtggcggacc 7080 
ctcgaagcct tctgggcgaa gcatatgtgg aatttcatca gcgggataca atatttagca 7140 
ggcttgtcca ctctgcctgg caaccccgcg atagcatcac tgatggcatt cacagcctct 7200 
atcaccagcc cgctcaccac ccaacatacc ctcctgttta acatcctggg gggatgggtg 7260 
gccgcccaac ttgctcctcc cagcgctgct tctgctttcg taggcgccgg catcgctgga 7320 
gcggctgttg gcagcatagg ccttgggaag gtgcttgtgg atattttggc aggttatgga 7380 
gcaggggtgg caggcgcgct cgtggccttt aaggtcatga gcggcgagat gccctccacc 7440 
gaggacctgg ttaacctact ccctgctatc ctctcccctg gcgccctagt cgtcggggtc 7500 
gtgtgcgcag cgatactgcg tcggcacgtg ggcccagggg agggggctgt gcagtggatg 7560 
aaccggctga tagcgttcgc ttcgcggggt aaccacgtct cccccacgca ctatgtgcct 7620 
gagagcgacg ctgcagcacg tgtcactcag atcctctcta .gtcttaccat cactcagctg 7680 
ctgaagaggc ttcaccagtg gatcaacgag gactgctcca cgccatgctc cggctcgtgg 7740 
ctaagagatg tttgggattg gatatgcacg gtgttgactg atttcaagac ctggctccag 7800 
tccaagctcc tgccgcgatt gccgggagtc cccttcttct catgtcaacg tgggtacaag 7860 
ggagtctggc ggggcgacgg catcatgcaa accacctgcc catgtggagc acagatcacc 7920 
ggacatgtga aaaacggttc catgaggatc gtggggccta ggacctgtag taacacgtgg 7980 
catggaacat tccccattaa cgcgtacacc acgggcccct gcacgccctc cccggcgcca 8040 
aattattcta gggcgctgtg gcgggtggct gctgaggagt acgtggaggt tacgcgggtg 8100 
ggggatttcc actacgtgac gggcatgacc actgacaacg taaagtgccc gtgtcaggtt 8160 
ccggcccccg aattcttcac agaagtggat ggggtgcggt tgcacaggta cgctccagcg 8220 
tgcaaacccc tcctacggga ggaggtcaca ttcctggtcg ggctcaatca atacctggtt 8280 
gggtcacagc tcccatgcga gcccgaaccg gacgtagcag tgctcacttc catgctcacc 8340 
gacccctccc acattacggc ggagacggct aagcgtaggc tggccagggg atctcccccc 8400 
tccttggcca gctcatcagc tagccagctg tctgcgcctt ccttgaaggc aacatgcact 8460 
acccgtcatg actccccgga cgctgacctc atcgaggcca acctcctgtg gcggcaggag 8520 
atgggcggga acatcacccg cgtggagtca gaaaataagg tagtaatttt ggactctttc 8580 
gagccgctcc aagcggagga ggatgagagg gaagtatccg ttccggcgga gatcctgcgg 8640 
aggtccagga aattccctcg agcgatgccc atatgggcac gcccggatta caaccctcca 8700 
ctgttagagt cctggaagga cccggactac gtccctccag tggtacacgg gtgtccattg 8760 
ccgcctgcca aggcccctcc gataccacct ccacggagga agaggacggt tgtcctgtca 8820 
gaatctaccg tgtcttctgc cttggcggag ctcgccacaa agaccttcgg cagctccgaa 8880 
tcgtcggccg tcgacagcgg cacggcaacg gcctctcctg accagccctc cgacgacggc 6940 
gacgcgggat ccgacgttga gtcgtactcc tccatgcccc cccttgaggg ggagccgggg 9000 
gatcccgatc tcagcgacgg gtcttggtct accgtaagcg aggaggctag tgaggacgtc 9060 
gtctgctgct cgatgtccta cacatggaca ggcgccctga tcacgccatg cgctgcggag 9120 
gaaaccaagc tgcccatcaa tgcactgagc aactctttgc tccgt caeca caacttggtc 9180 
tatgetacaa catctcgcag cgcaagcctg eggcagaaga aggtcacctt tgacagactg 9240 
caggtcctgg acgaccacta ccgggacgtg ctcaaggaga tgaaggcgaa ggcgtccaca 9300 
gttaaggcta aacttctatc cgtggaggaa gectgtaage tgacgccccc acattcggcc 9360 
agatctaaat ttggctatgg ggcaaaggac gtccggaacc tatccagcaa ggccgttaac 9420 
cacatccgct ccgtgtggaa ggacttgctg gaagacactg agacaccaat tgacaccacc 9460 
ateatggcaa aaaatgaggt tttctgcgtc caaccagaga aggggggecg caagccagct 9540 
cgccttatcg tattcccaga tttgggggtt cgtgtgtgcg agaaaatggc cctttacgat 9600 
gtggtctcca ccctccctca ggccgtgatg ggctcttcat aeggattcca atactctcct 9660 
ggacagcggg tcgagttcct ggtgaatgcc tggaaagega agaaatgece tatgggcttc 9720 
gcatatgaca cccgctgttt tgactcaacg gtcactgaga atgacatccg tgttgaggag 9780 
tcaatctacc aatgttgtga cttggccccc gaagecagae aggecataag gtcgctcaca 9840 
gageggcttt acateggggg ccccctgact aattctaaag ggcagaactg cggctatcgc 9900 
cggtgccgcg cgagcggtgt actgacgacc agetgeggta ataccctcac atgttacttg 9960 
aaggccgctg cggcctgtcg agetgegaag ctccaggact geacgatget cgtatgcgga 10020 
gacgaccttg tcgttatctg tgaaagcgcg gggacccaag aggacgaggc gagectaegg 10080 
gccttcacgg aggctatgac tagatactct gccccccctg gggacccgcc caaaccagaa 10140 
tacgacttgg agttgataac atcatgctcc tccaatgtgt cagtcgcgca egatgeatet 10200 
ggcaaaaggg tgtactatct cacccgtgac cccaccaccc cccttgcgcg qgctgcgtgg 10260 
gagacagcta gacacactcc agtcaattcc tggctaggca acatcatcat gtatgcgccc 10320 
accttgtggg caaggatgat cctgatgact catttcttct ccatccttct agctcaggaa 10380 
caacttgaaa aagecctaga ttgtcagatc taeggggect gttactccat tgagecaett 10440 
gacctacctc agatcattca acgactccat ggccttagcg cattttcact ccatagttac 10500 
tctccaggtg agatcaatag ggtggcttca tgcctcagga aacttggggt accgcccttg 10560 
cgagtctgga gaeateggge cagaagtgtc cgcgctaggc tactgtccca gggggggagg 10620 
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gctgccactt gtggcaagta cctcttcaac tgggcagtaa ggaccaagct caaactcact 10680 

ccaatcccgg ctgcgtccca gttggattta tccagctggt tcgttgctgg ttacagcggg 10740 

ggagacatat atcacagcct gtctcgtgcc cgaccccgct ggttcatgtg gtgcctactc 10800 

ctactttctg taggggtagg catctatcta ctccccaacc gatgaacggg gagctaaaca 10860 

ctccaggcca ataggccatc ctgttttttt cccttttttt ttttcttttt tttttttttt 10920 

tttttttttt tttttttttc tccttttttt ttcctctttt tttccttttc tttcctttgg 10980 

tggctccatc ttagccctag tcacggctag ctgtgaaagg tccgtgagcc gcttgactgc 11040 

agagagtgct gatactggcc tctctgcaga tcaagt 11076 
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<210> 2 
<211> 8637 
<212> DNA 

<2X3> Hepatitis C Virus 

<400> 2 4 cn 

gccagccccc gattgggggc gacactccac catagatcaq tcccctgtga ggaactactg 60 
tcttcacgca gaaagcgtct agccatggcg ttagtatgag tgtcgtgcag cctccaggac 120 
cccccctccc gggagagcca tagtggtctg cggaaccggt gagtacaccg gaattgccag 180 
gacgaccggg tcctttcttg gatcaacccg ctcaatgcct ggagatttgg gcgtgccccc 240 
gcgagactgc tagccgagta gtgttgggtc gcgaaaggcc ttgtggtact gcctgatagg 300 
gtgcttgcga gtgccccggg aggtctcgta gaccgtgcac catgagcacg aatcctaaac 360 
ctcaaagaaa aaccaaaggg cgcgccatga ttgaacaaga tggattgcac gcaggttctc 420 
cggccgcttg ggtggagagg ctattcggct atgactgggc acaacagaca atcggctgct 480 
ctgatgccgc cgtgttccgg ctgtcagcgc aggggcgccc ggttcttttt gtcaagaccg 540 
acctgtccgg tgccctgaat gaactgcagg acgaggcagc gcggctatcg tggctggcca 600 
cgacgggcgt tccttgcgca gctgtgctcg acgttgtcac tgaagcggga agggactggc 660 
tgctattggg cgaagtgccg gggcaggatc tcctgtcatc tcaccttgct cctgccgaga 720 
aagtatccat catggctgat gcaatgcggc ggctgcatac gcttgatccg gctacctgcc 780 
cattcgacca ccaagcgaaa catcgcatcg agcgagcacg tactcggatg gaagccggtc 840 
ttgtcgatca ggatgatctg gacgaagagc atcaggggct cgcgccagcc gaactgttcg 900 
ccaggctcaa ggcgcgcatg cccgacggcg aggatctcgt cgtgacccat ggcgatgcct 960 
gcttgccgaa tatcatggtg gaaaatggcc gcttttctgg attcatcgac tgtggccggc 1020 
tgggtgtggc ggaccgctat caggacatag cgttggctac ccgtgatatt gctgaagagc 1080 
ttggcggcga atgggctgac cgcttcctcg tgctttacgg tatcgccgct cccgattcgc 1140 
agcgcatcgc cttctatcgc cttcttgacg agttcttctg agtttaaaca gaccacaacg 1200 
gtttccctct agcgggatca attccgcccc tctccctccc ccccccctaa cgttactggc 1260 
cgaagccgct tggaataagg ccggtgtgcg tttgtctata tgttattttc caccatattg 1320 
ccgtcttttg gcaatgtgag ggcccggaaa cctggccctg tcttcttgac gagcattcct 1380 
aggggtcttt cccctctcgc caaaggaatg caaggtctgt tgaatgtcgt gaaggaagca 1440 
gttcctctgg aagcttcttg aagacaaaca acgtctgtag cgaccctttg caggcagcgg 1500 
aaccccccac ctggcgacag gtgcctctgc ggccaaaagc cacgtgtata agatacacct 1560 
gcaaaggcgg cacaacccca gtgccacgtt gtgagttgga tagttgtgga aagagtcaaa 1620 
tggctctcct caagcgtatt caacaagggg ctgaaggatg cccagaaggt accccattgt 1680 
atgggatctg atctggggcc tcggtgcaca tgctttacat gtgtttagtc gaggttaaaa 1740 
aacgtctagg ccccccgaac cacggggacg tggttttcct ttgaaaaaca cgataatacc 1800 
atggaccggg agatggcagc atcgtgcgga ggcgcggttt tcgtaggtct gatactcttg 1860 
accttgtcac cgcactataa gctgttcctc gctaggctca tatggtggtt acaatatttt 1920 
atcaccaggg ccgaggcaca cttgcaagtg tggatccccc ccctcaacgt tcgggggggc 1980 
cgcgatgccg tcatcctcct cacgtgcgcg atccacccag agctaatctt taccatcacc 2040 
aaaatcttgc tcgccatact cggtccactc atggtgctcc aggctggtat aaccaaagtg 2100 
ccgtacttcg tgcgcgcaca cgggctcatt cgtgcatgca tgctggtgcg gaaggttgct 2160 
gggggtcatt atgtccaaat ggctctcatg aagttggccg cactgacagg tacgtacgtt 2220 
tatgaccatc tcaccccact gcgggactgg gcccacgcgg gcctacgaga ccttgcggtg 2280 
gcagttgagc ccgtcgtctt ctctgatatg gagaccaagg ttatcacctg gggggcagac 2340 
accgcggcgt gtggggacat catcttgggc ctgcccgtct ccgcccgcag ggggagggag 2400 
atacatctgg gaccggcaga cagccttgaa gggcaggggt ggcgactcct cgcgcctatt 2460 
acggcctact cccaacagac gcgaggccta cttggctgca tcatcactag cctcacaggc 2520 
cgggacagga accaggtcga gggggaggtc caagtggtct ccaccgcaac acaatctttc 2580 
ctggcgacct gcgtcaatgg cgtgtgttgg actgtctatc atggtgccgg ctcaaagacc 2640 
cttgccggcc caaagggccc aatcacccaa atgtacacca atgtggacca ggacctcgtc 2700 
ggctggcaag cgccccccgg ggcgcgttcc ttgacaccat gcacctgcgg cagctcggac 2760 
ctttacttgg tcacgaggca tgccgatgtc attccggtgc gccggcgggg cgacagcagg 2820 
gggagcctac tctcccccag gcccgtctcc tacttgaagg gctcttcggg cggtccactg 2880 
ctctgcccct cggggcacgc tgtgggcatc tttcgggctg ccgtgtgcac ccgaggggtt 2940 
gcgaaggcgg tggactttgt acccgtcgag tctatggaaa ccactatgcg gtccccggtc 3000 
ttcacggaca actcgtcccc tccggccgta ccgcagacat tccaggtggc ccatctacac 3060 
gcccctactg gtagcggcaa gagcactaag gtgccggctg cgtatgcagc ccaagggtat 3120 
aaggtgcttg tcctgaaccc gtccgtcgcc gccaccctag gtttcggggc gtatatgtct 3180 
aaggcacatg gtatcgaccc taacatcaga accggggtaa ggaccatcac cacgggtgcc 3240 
cccatcacgt actccaccta tggcaagttt cttgccgacg gtggttgctc tgggggcgcc 3300 
tatgacatca taatatgtga tgagtgccac tcaactgact cgaccactat cctgggcatc 3360 
ggcacagtcc tggaccaagc ggagacggct ggagcgcgac tcgtcgtgct cgccaccgct 3420 
acgcctccgg gatcggtcac cgtgccacat ccaaacatcg aggaggtggc tctgtccagc 3480 
actggagaaa tcccctttta tggcaaagcc atccccatcg agaccatcaa gggggggagg 3540 
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cacctcattt tctgccattc caagaagaaa 
ctcggactca atgctgtagc atattaccgg 
ggagacgtca ttgtcgtagc aacggacgct 
tcagtgatcg actgcaatac atgtgtcacc 
ttcaccattg agacgacgac cgtgccacaa 
aggactggta ggggcaggat gggcatttac 
ggcatgttcg attcctcggt tctgtgcgag 
ctcacgcccg ccgagacctc agttaggttg 
gtctgccagg accatctgga gttctgggag 
gcccatttct tgtcccagac taagcaggca 
caggctacgg tgtgcgccag ggctcaggct 
tgtctcatac ggctaaagcc tacgctgcac 
gcegttcaaa acgaggttac taccacacac 
tcggctgacc tggaggtcgt cacgagcacc 
ctggccgcgt attgcctgac aacaggcagc 
ggaaagccgg cca teat tec cgacagggaa 
gagtgegect cacacctccc ttacatcgaa 
cagaaggcaa tegggttget gcaaacagcc 
gtggaatcca agtggcggac cctcgaagcc 
agegggatae aatatttagc aggcttgtcc 
ctgatggcat tcacagcctc tatcaccagc 
aacatcctgg ggggatgggt ggccgcccaa 
gtaggcgccg geategctgg agcggctgtt 
gatattttgg caggttatgg agcaggggtg 
ageggegaga tgccctccac cgaggacctg 
ggcgccctag tegteggggt cgtgtgcgca 
gagggggctg tgcagtggat gaaccggctg 
tcccccacgc actatgtgcc tgagagegae 
agtcttacca tcactcagct gctgaagagg 
acgccatgct ccggctcgtg gctaagagat 
gatttcaaga cctggctcca gtccaagctc 
tcatgtcaac gtgggtacaa gggagtctgg 
ccatgtggag cacagatcac cggacatgtg 
aggacctgta gtaacacgtg gcatggaaca 
tgcacgccct ccccggcgcc aaattattct 
tacgtggagg ttacgcgggt gggggatttc 
gtaaagtgcc cgtgtcaggt tccggccccc 
ttgcacaggt acgctccagc gtgcaaaccc 
gggctcaatc aatacctggt tgggtcacag 
gtgetcaett ccatgctcac cgacccctcc 
ctggccaggg gatctccccc ctccttggcc 
tccttgaagg caacatgcac tacccgtcat 
aacctcctgt ggcggcagga gatgggcggg 
gtagtaattt tggactcttt cgagccgctc 
gttceggegg agatcctgeg gaggtccagg 
cgcccggatt acaaccctcc actgttagag 
gtggtacacg ggtgtccatt gccgcctgcc 
aagaggaegg ttgtcctgtc agaatctacc 
aagaccttcg gcagctccga atcgtcggcc 
gaccagccct ccgacgacgg egacgeggga 
ccccttgagg gggagccggg ggatcccgat 
gaggaggcta gtgaggacgt cgtctgctgc 
atcacgccat gcgctgcgga ggaaaccaag 
ctccgtcacc acaacttggt etatgetaca 
aaggtcacct ttgacagact gcaggtcctg 
atgaaggega aggcgtccac agttaaggct 
ctgacgcccc cacattcggc cagatctaaa 
ctatccagca aggccgttaa ccacatccgc 
gagacaccaa ttgacaccac catcatggca 
aaggggggee gcaagccagc tcgccttatc 
gagaaaatgg ccctttacga tgtggtctcc 
taeggattec aatactctcc tggacagegg 
aagaaatgee ctatgggctt egcatatgae 
aatgacatcc gtgttgagga gtcaatctac 
caggecataa ggtcgctcac agageggett 
gggcagaact geggctateg ccggtgccgc 



tgtgatgagc tcgccgcgaa gctgtccggc 3600 
ggccttgatg tatcegtcat accaactagc 3660 
etaatgaegg getttacegg cgatttcgac 3720 
cagacagtcg acttcagcct ggacccgacc 3780 
gacgcggtgt cacgctcgca geggegagge 3B40 
aggtttgtga ctccaggaga acggccctcg 3900 
tgctatgacg cgggctgtgc ttggtacgag 3960 
cgggcttacc taaacacacc agggttgece 4020 
agegtcttta caggcctcac ccacatagac 4080 
ggagacaaet tcccctacct ggtagcatac 4140 
ccacctccat cgtgggacca aatgtggaag 4200 
gggccaacgc ccctgctgta taggctggga 4260 
cccataacca aatacatcat ggcatgcatg 4320 
tgggtgctgg taggeggagt cctagcagct 4360 
gtggtcattg tgggcaggat catcttgtcc 4440 
gtcctttacc gggagttcga tgagatggaa 4500 
cagggaatgc agctcgccga acaattcaaa 4560 
accaagcaag eggaggctge tgctcccgtg 4620 
ttctgggcga agcatatgtg gaatttcatc 4680 
actctgcctg gcaaccccgc gatagcatca 4740 
ccgctcacca cccaacatac cctcctgttt 4800 
cttgctcctc ccagcgctgc ttctgettte 4860 
ggcagcatag gccttgggaa ggtgettgtg 4920 
gcaggcgcgc tcgtggcctt taaggtcatg 4980 
gttaacctac tccctgctat cctctcccct 5040 
gcgatactgc gtcggcacgt gggcccaggg 5100 
atagegtteg ettcgegggg taaccacgtc 5160 
gctgcagcac gtgtcactca gatcctctct 5220 
cttcaccagt ggatcaacga ggactgctcc 5280 
gtttgggatt ggatatgeae ggtgttgact 5340 
ctgccgcgat tgccgggagt ccccttcttc 5400 
eggggegacg geatcatgea aaccacctgc 5460 
aaaaacggtt ccatgaggat cgtggggcct 5520 
ttccccatta acgcgtacac cacgggcccc 5580 
agggegctgt ggcgggtggc tgctgaggag 5640 
cactacgtga egggcatgae cactgacaac 5700 
gaattettca cagaagtgga tggggtgcgg 5760 
ctcctacggg aggaggtcac attcctggtc 5820 
ctcccatgcg agcccgaacc ggaegtagea 5880 
cacattaegg eggagaegge taagegtagg 5940 
agctcatcag ctagccagct gtctgcgcct 6000 
gactccccgg acgctgacct catcgaggcc 6060 
aacatcaccc gcgtggagtc agaaaataag 6120 
caageggagg aggatgagag ggaagtatcc 6180 
aaattccctc gagegatgee catatgggca 6240 
tcctggaagg acccggacta cgtccctcca 6300 
aaggcccctc cgataccacc tecaeggagg 6360 
gtgtcttctg ccttggcgga gctcgccaca 6420 
gtcgacagcg gcacggcaac ggcctctcct 6480 
tccgacgttg agtegtaetc ctccatgccc 6540 
ctcagcgacg ggtcttggtc tacegtaage 6600 
tcgatgtcct acacatggac aggcgccctg 6660 
ctgcccatca atgeactgag eaactctttg 6720 
acatctcgca gcgcaagcct gcggcagaag 6780 
gacgaccact acegggaegt gctcaaggag 6840 
aaacttctat ccgtggagga agcctgtaag 6900 
tttggctatg gggcaaagga cgtccggaac 6960 
tccgtgtgga aggacttget ggaagacact 7020 
aaaaatgagg ttttctgcgt ccaaccagag 7080 
gtattcccag atttgggggt tcgtgtgtgc 7140 
aecctccctc aggcegtgat gggctcttca 7200 
gtcgagttcc tggtgaatgc ctggaaageg 7260 
acccgctgtt ttgactcaac ggtcactgag 7320 
caatgttgtg acttggcccc egaagecaga 7380 
tacategggg gccccctgac taattctaaa 7440 
gcgagcggtg tactgacgac cagctgeggt 7500 
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aataccctca catgttactt gaaggccgct 
tgcacgatgc tcgtatgcgg agacgacctt 
gaggacgagg cgagcctacg ggccttcacg 
ggggacccgc ccaaaccaga atacgacttg 
tcagtcgcgc acgatgcatc tggcaaaagg 
ccccttgcgc gggctgcgtg ggagacagct 
aacatcatca tgtatgcgcc caccttgtgg 
tccatccttc tagctcagga acaacttgaa 
tgttactcca ttgagccact tgacctacct 
gcattttcac tccatagtta ctctccaggt 
aaacttgggg taccgccctt gcgagtctgg 
ctactgtccc agggggggag ggctgccact 
aggaccaagc tcaaactcac tccaatcccg 
ttcgttgctg gttacagcgg gggagacata 
tggttcatgt ggtgcctact cctactttct 
cgatgaacgg ggagctaaac actccaggcc 
tttttctttt tttttttttt tttttttttt 
ttttcctttt ctttcctttg gtggctccat 
gtccgtgagc cgcttgactg cagagagtgc 



gcggcctgtc gagctgcgaa gctccaggac 7560 
gtcgttatct gtgaaagcgc ggggacccaa 7620 
gaggctatga ctagatactc tgccccccct 7680 
gagttgataa catcatgctc ctccaatgtg 7740 
gtgtactatc tcacccgtga ccccaccacc 7800 
agacacactc cagtcaattc ctggctaggc 7860 
gcaaggatga tcctgatgac tcatttcttc 7920 
aaagccctag attgtcagat ctacggggcc 7980 
cagatcattc aacgactcca tggccttagc 8040 
gagatcaata gggtggcttc atgcctcagg 8100 
agacatcggg ccagaagtgt ccgcgctagg 8160 
tgtggcaagt acctcttcaa ctgggcagta 8220 
gctgcgtccc agttggattt atccagctgg 8280 
tatcacagcc tgtctcgtgc ccgaccccgc 8340 
gtaggggtag gcatctatct actccccaac 8400 
aataggccat cctgtttttt tccctttttt 8460 
tttttttttt ctcctttttt tttcctcttt 8520 
cttagcccta gtcacggcta gctgtgaaag 8580 
tgatactggc ctctctgcag atcaagt 8637 
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<210> 3 
<211> 8001 
<212> UNA 

_ <213> Hepatitis C Virus 

5 

<400> 3 

gccagccccc gattgggggc gacactccac catagatcac tcccctgtga ggaactactg 60 

tcttcacgca gaaagcgtct agccatggcg ttagtatgag tgtcgtgcag cctccaggac 120 

cccccctccc gggagagcca tagtggtctg cggaaccggt gagtacaccg gaattgccag 180 

gacgaccggg tcctttcttg gatcaacccg ctcaatgcct ggagatttgg gcgtgccccc 240 

10 gcgagactgc tagccgagta gtgttgggtc gcgaaaggcc ttgtggtact gcctgatagg 300 

gtgcttgcga gtgccccggg aggtctcgta gaccgtgcac catgagcacg aatcctaaac 360 

ctcaaagaaa aaccaaacgt aacaccaacg ggcgcgccat gattgaacaa gatggattgc 420 

acgcaggttc tccggccgct tgggtggaga ggctattcgg ctatgactgg gcacaacaga 480 

caatcggctg ctctgatgcc gccgtgttcc ggctgtcagc gcaggggcgc ccggttcttt 540 

ttgtcaagac cgacctgtcc ggtgccctga atgaactgca ggacgaggca gcgcggctat 600 

cgtggctggc cacgacgggc gttccttgcg cagctgtgct cgacgttgtc actgaagcgg 660 

gaagggactg gctgctattg ggcgaagtgc cggggcagga tctcctgtca tctcaccttg 720 

ctcctgccga gaaagtatcc atcatggctg atgcaatgcg gcggctgcat acgcttgatc 780 

cggctacctg cccattcgac caccaagcga aacatcgcat cgagcgagca cgtactcgga 840 

tggaagccgg tcttgtcgat caggatgatc tggacgaaga gcatcagggg ctcgcgccag 900 

ccgaactgtt cgccaggctc aaggcgcgca tgcccgacgg cgaggatctc gtcgtgaccc 960 

atggcgatgc ctgcttgccg aatatcatgg tggaaaatgg ccgcttttct ggattcatcg 1020 

20 actgtggccg gctgggtgtg gcggaccgct atcaggacat agcgttggct acccgtgata 1080 

ttgctgaaga gcttggcggc gaatgggctg accgcttcct cgtgctttac ggtatcgccg 1140 

ctcccgattc gcagcgcatc gccttctatc gccttcttga cgagttcttc tgagtttaaa 1200 

cagaccacaa cggtttccct ctagcgggat caattccgcc cctctccctc ccccccccct 1260 

aacgttactg gccgaagccg cttggaataa ggccggtgtg cgtttgtcta tatgttattt 1320 

tccaccatat tgccgtcttt tggcaatgtg agggcccgga aacctggccc tgtcttcttg 1380 

25 acgagcattc ctaggggtct ttcccctctc gccaaaggaa tgcaaggtct gttgaatgtc 1440 

gtgaaggaag cagttcctct ggaagcttct tgaagacaaa caacgtctgt agcgaccctt 1500 

tgcaggcagc ggaacccccc acctggcgac aggtgcctct gcggccaaaa gccacgtgta 1560 

taagatacac ctgcaaaggc ggcacaaccc cagtgccacg ttgtgagttg gatagttgtg 1620 

gaaagagtca aatggctctc ctcaagcgta ttcaacaagg ggctgaagga tgcccagaag 1680 

gtaccccatt gtatgggatc tgatctgggg cctcggtgca catgctttac atgtgtttag 1740 

tcgaggttaa aaaacgtcta ggccccccga accacgggga cgtggttttc ctttgaaaaa 1600 

30 cacgataata ccatggcgcc tattacggcc tactcccaac agacgcgagg cctacttggc 1860 

tgcatcatca ctagcctcac aggccgggac aggaaccagg tcgaggggga ggtccaagtg 1920 

gtctccaccg caacacaatc tttcctggcg acctgcgtca atggcgtgtg ttggactgtc 1980 

tatcatggtg ccggctcaaa gacccttgcc ggcccaaagg gcccaatcac ccaaatgtac 2040 

accaatgtgg accaggacct cgtcggctgg caagcgcccc ccggggcgcg ttccttgaca 2100 

ccatgcacct gcggcagctc ggacctttac ttggtcacga ggcatgccga tgtcattccg 2160 

35 gtgcgccggc ggggcgacag cagggggagc ctactctccc ccaggcccgt ctcctacttg 2220 

aagggctctt cgggcggtcc actgctctgc ccctcggggc acgctgtggg catctttcgg 2260 

gctgccgtgt gcacccgagg ggttgcgaag gcggtggact ttgtacccgt cgagtctatg 2340 

gaaaccacta tgcggtcccc ggtcttcacg gacaactcgt cccctccggc cgtaccgcag 2400 

acattccagg tggcccatct acacgcccct actggtagcg gcaagagcac taaggtgccg 2460 

gctgcgtatg cagcccaagg gtataaggtg cttgtcctga acccgtccgt cgccgccacc 2520 

ctaggtttcg gggcgtatat gtctaaggca catggtatcg accctaacat cagaaccggg 2580 

40 gtaaggacca tcaccacggg tgcccccatc acgtactcca cctatggcaa gtttcttgcc 2640 

gacggtggtt gctctggggg cgcctatgac atcataatat gtgatgagtg ccactcaact 2700 

gactcgacca ctatcctggg catcggcaca gtcctggacc aagcggagac ggctggagcg 2760 

cgactcgtcg tgctcgccac cgctacgcct ccgggatcgg tcaccgtgcc acatccaaac 2820 

atcgaggagg tggctctgtc cagcactgga gaaatcccct tttatggcaa agccatcccc 2880 

atcgagacca tcaagggggg gaggcacctc attttctgcc attccaagaa gaaatgtgat 2940 

45 gagctcgccg cgaagctgtc cggcctcgga ctcaatgctg tagcatatta ccggggcctt 3000 

gatgtatccg tcataccaac tagcggagac gtcattgtcg tagcaacgga cgctctaatg 3060 

acgggcttta ccggcgattt cgactcagtg atcgactgca atacatgtgt cacccagaca 3120 

gtcgacttca gcctggaccc gaccttcacc attgagacga cgaccgtgcc acaagacgcg 3180 

gtgtcacgct cgcagcggcg aggcaggact ggtaggggca ggatgggcat ttacaggttt 3240 

gtgactccag gagaacggcc ctcgggcatg ttcgattcct cggttctgtg cgagtgctat 3300 

gacgcgggct gtgcttggta cgagctcacg cccgccgaga cctcagttag gttgcgggct 3360 

tacctaaaca caccagggtt gcccgtctgc caggaccatc tggagttctg ggagagcgtc 3420 

tttacaggcc tcacccacat agacgcccat ttcttgtccc agactaagca ggcaggagac 3460 

aacttcccct acctggtagc ataccaggct acggtgtgcg ccagggctca ggctccacct 3540 
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ccatcgtggg accaaatgtg gaagtgtctc atacggctaa agcctacgct gcacgggcca 3600 
acgcccctgc tgtataggct gggagccgtt caaaacgagg ttactaccac acaccccata 3660 
accaaataca tcatggcatg catgtcggct gacctggagg tcgtcacgag cacctgggtg 3720 
ctggtaggcg gagtcctagc agctctggcc gcgtattgcc tgacaacagg cagcgtggtc 3780 
attgtgggca ggatcatctt gtccggaaag ccggccatca ttcccgacag ggaagtcctt 3840 
taccgggagt tcgatgagat ggaagagtgc gcctcacacc tcccttacat cgaacaggga 3900 
atgcagctcg ccgaacaatt caaacagaag gcaatcgggt tgctgcaaac agccaccaag 3960 
caagcggagg ctgctgctcc cgtggtggaa tccaagtggc ggaccctcga agccttctgg 4020 
gcgaagcata tgtggaattt catcagcggg atacaatatt tagcaggctt gtccactctg 4060 
cctggcaacc ccgcgatagc atcactgatg gcattcacag cctctatcac cagcccgctc 4140 

10 accacccaac ataccctcct gtttaacatc ctggggggat gggtggccgc ccaacttgct 4200 

cctcccagcg ctgcttctgc tttcgtaggc gccggcatcg ctggagcggc tgttggcagc 4260 
ataggccttg ggaaggtgct tgtggatatt ttggcaggtt atggagcagg ggtggcaggc 4320 
gcgctcgtgg cctttaaggt catgagcggc gagatgccct ccaccgagga cctggttaac 4380 
ctactccctg ctatcctctc ccctggcgcc ctagtcgtcg gggtcgtgtg cgcagcgata 4440 
ctgcgtcggc acgtgggccc aggggagggg gctgtgcagt ggatgaaccg gctgatagcg 4500 
ttcgcttcgc ggggtaacca cgtctccccc acgcactatg tgcctgagag cgacgctgca 4560 

15 gcacgtgtca ctcagatcct ctctagtctt accatcactc agctgctgaa gaggcttcac 4620 

cagtggatca acgaggactg ctccacgcca tgctccggct cgtggctaag agatgtttgg 4680 
gattggatat gcacggtgtt gactgatttc aagacctggc tccagtccaa gctcctgccg 4740 
cgattgccgg gagtcccctt cttctcatgt caacgtgggt acaagggagt ctggcggggc 4800 
gacggcatca tgcaaaccac ctgcccatgt ggagcacaga tcaccggaca tgtgaaaaac 4860 
ggttccatga ggatcgtggg gcctaggacc tgtagtaaca cgtggcatgg aacattcccc 4920 

20 attaacgcgt acaccacggg cccctgcacg ccctccccgg cgccaaatta ttctagggcg 4980 

ctgtggcggg tggctgctga ggagtacgtg gaggttacgc gggtggggga tttccactac 5040 
gtgacgggca tgaccactga caacgtaaag tgcccgtgtc aggttccggc ccccgaattc 5100 
ttcacagaag tggatggggt gcggttgcac aggtacgctc cagcgtgcaa acccctccta 5160 
cgggaggagg tcacattcct ggtcgggctc aatcaatacc tggttgggtc acagctccca 5220 
tgcgagcccg aaccggacgt agcagtgctc acttccatgc tcaccgaccc ctcccacatt 5280 
acggcggaga cggctaagcg taggctggcc aggggatctc ccccctcctt ggccagctca 5340 

25 tcagctagcc agctgtctgc gccttccttg aaggcaacat gcactacccg tcatgactcc 5400 

ccggacgctg acctcatcga ggccaacctc ctgtggcggc aggagatggg cgggaacatc 5460 
acccgcgtgg agtcagaaaa taaggtagta attttggact ctttcgagcc gctccaagcg 5520 
gaggaggatg agagggaagt atccgttccg gcggagatcc tgcggaggtc caggaaattc 5580 
cctcgagcga tgcccatatg ggcacgcccg gattacaacc ctccactgtt agagtcctgg 5640 
aaggacccgg actacgtccc tccagtggta cacgggtgtc cattgccgcc tgccaaggcc 5700 

30 cctccgatac cacctccacg gaggaagagg acggttgtcc tgtcagaatc taccgtgtct 5760 

tctgccttgg cggagctcgc cacaaagacc ttcggcagct ccgaatcgtc ggccgtcgac 5820 
agcggcacgg caacggcctc tcctgaccag ccctccgacg acggcgacgc gggatccgac 5880 
gttgagtcgt actcctccat gccccccctt gagggggagc cgggggatcc cgatctcagc 5940 
gacgggtctt ggtctaccgt aagcgaggag gctagtgagg acgtcgtctg ctgctcgatg 6000 
tcctacacat ggacaggcgc cctgatcacg ccatgcgctg cggaggaaac caagctgccc 6060 
atcaatgcac tgagcaactc tttgctccgt caccacaact tggtctatgc tacaacatct 6120 

35 cgcagcgcaa gcctgcggca gaagaaggtc acctttgaca gactgcaggt cctggacgac 6180 

cactaccggg acgtgctcaa ggagatgaag gcgaaggcgt ccacagttaa ggctaaactt 6240 
ctatccgtgg aggaagcctg taagctgacg cccccacatt cggccagatc taaatttggc 6300 
tatggggcaa aggacgtccg gaacctatcc agcaaggccg ttaaccacat ccgctccgtg 6360 
tggaaggact tgctggaaga cactgagaca ccaattgaca ccaccatcat ggcaaaaaat 6420 
gaggttttct gcgtccaacc agagaagggg ggccgcaagc cagctcgcct tatcgtattc 6480 

40 ccagatttgg gggttcgtgt gtgcgagaaa atggcccttt acgatgtggt ctccaccctc 6540 

cctcaggccg tgatgggctc ttcatacgga ttccaatact ctcctggaca gcgggtcgag 6600 
ttcctggtga atgcctggaa agcgaagaaa tgccctatgg gcttcgcata tgacacccgc 6660 
tgttttgact caacggtcac tgagaatgac atccgtgttg aggagtcaat ctaccaatgt 6720 
tgtgacttgg cccccgaagc cagacaggcc ataaggtcgc tcacagagcg gctttacatc 6780 
gggggccccc tgactaattc taaagggcag aactgcggct atcgccggtg ccgcgcgagc 6840 
ggtgtactga cgaccagctg cggtaatacc ctcacatgtt acttgaaggc cgctgcggcc 6900 
tgtcgagctg cgaagctcca ggactgcacg atgctcgtat gcggagacga ccttgtcgtt 6960 
atctgtgaaa gcgcggggac ccaagaggac gaggcgagcc tacgggcctt cacggaggct 7020 
atgactagat actctgcccc ccctggggac ccgcccaaac cagaatacga cttggagttg 7080 
ataacatcat gctcctccaa tgtgtcagtc gcgcacgatg catctggcaa aagggtgtac 7140 
tatctcaccc gtgaccccac cacccccctt gcgcgggctg cgtgggagac agctagacac 7200 
actccagtca attcctggct aggcaacatc atcatgtatg cgcccacctt gtgggcaagg 7260 

SO atgatcctga tgactcattt cttctccatc cttctagctc aggaacaact tgaaaaagcc 7320 

ctagattgtc agatctacgg ggcctgttac tccattgagc cacttgacct acctcagatc 7380 
attcaacgac tccatggcct tagcgcattt tcactccata gttactctcc aggtgagatc 7440 
aatagggtgg cttcatgcct caggaaactt ggggtaccgc ccttgcgagt ctggagacat 7500 
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cgggccagaa gtgtccgcgc taggctactg 
aagtacctct tcaactgggc agtaaggacc 
tcccagttgg atttatccag ctggttcgtt 
agcctgtctc gtgcccgacc ccgctggttc 
gtaggcatct atctactccc caaccgatga 
ccatcctgtt tttttccctt tttttttttc 
ttttctcctt tttttttcct ctttttttcc 
cctagtcacg gctagctgtg aaaggtccgt 
tggcctctct gcagatcaag t 



tcccaggggg ggagggctgc cacttgtggc 7560 
aagctcaaac tcactccaat cccggctgcg 7620 
gctggttaca gcgggggaga catatatcac 7680 
atgtggtgcc tactcctact ttctgtaggg 7740 
acggggagct aaacactcca ggccaatagg 7800 
tttttttttt tttttttttt tttttttttt 7860 
ttttctttcc tttggtggct ccatcttagc 7920 
gagccgcttg actgcagaga gtgctgatac 7980 
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<210> 4 
<211> 7969 
<212> DNA 

<213> Hepatitis C Virus 
<400> 4 

gccagccccc gattgggggc gacactccac catagatcac tcccctgtga ggaactactg 60 
tcttcacgca gaaagcgtct agccatggcg ttagtatgag tgtcgtgcag cctccaggac 120 
cccccctccc gggagagcca tagtggtctg cggaaccggt gagtacaccg gaattgccag 180 
gacgaccggg tcctttcttg gatcaacccg ctcaatgcct ggagatttgg gcgtgccccc 240 
gcgagactgc tagccgagta gtgttgggtc gcgaaaggcc ttgtggtact gcctgatagg 300 
gtgcttgcga gtgccccggg aggtctcgta gaccgtgcac catgagcacg aatcctaaac 360 
ctcaaagaaa aaccaaaggg cgcgccatga ttgaacaaga tggattgcac gcaggttctc 420 
cggccgcttg ggtggagagg ctattcggct atgactgggc acaacagaca atcggctgct 480 
ctgatgccgc cgtgttccgg ctgtcagcgc aggggcgccc ggttcttttt gtcaagaccg 540 
acctgtccgg tgccctgaat gaactgcagg acgaggcagc gcggctatcg tggctggcca 600 
cgacgggcgt tccttgcgca gctgtgctcg acgttgtcac tgaagcggga agggactggc 660 
tgctattggg cgaagtgccg gggcaggatc tcctgtcatc tcaccttgct cctgccgaga 720 
aagtatccat catggctgat gcaatgcggc ggctgcatac gcttgatccg gctacctgcc 780 
cattcgacca ccaagcgaaa catcgcatcg agcgagcacg tactcggatg gaagccggtc 840 
ttgtcgatca ggatgatctg gacgaagagc atcaggggct cgcgccagcc gaactgttcg 900 
ccaggctcaa ggcgcgcatg cccgacggcg aggatctcgt cgtgacccat ggcgatgcct 960 
gcttgccgaa tatcatggtg gaaaatggcc gcttttctgg attcatcgac tgtggccggc 1020 
tgggtgtggc ggaccgctat caggacatag qgttggctac ccgtgatatt gctgaagagc 1080 
ttggcggcga atgggctgac cgcttcctcg tgctttacgg tatcgccgct cccgattcgc 1140 
agcgcatcgc cttctatcgc cttcttgacg agttcttctg agtttaaaca gaccacaacg 1200 
gtttccctct agcgggatca attccgcccc tctccctccc ccccccctaa cgttactggc 1260 
cgaagccgct tggaataagg ccggtgtgcg tttgtctata tgttattttc caccatattg 1320 
ccgtcttttg gcaatgtgag ggcccggaaa cctggccctg tcttcttgac gagcattcct 1380 
aggggtcttt cccctctcgc caaaggaatg caaggtctgt tgaatgtcgt gaaggaagca 1440 
gttcctctgg aagcttcttg aagacaaaca acgtctgtag cgaccctttg caggcagcgg 1500 
aaccccccac ctggcgacag gtgcctctgc ggccaaaagc cacgtgtata agatacacct 1560 
gcaaaggcgg cacaacccca gtgccacgtt gtgagttgga tagttgtgga aagagtcaaa 1620 
tggctctcct caagcgtatt caacaagggg ctgaaggatg cccagaaggt accccattgt 1680 
atgggatctg atctggggcc tcggtgcaca tgctttacat gtgtttagtc gaggttaaaa 1740 
aacgtctagg ccccccgaac cacggggacg tggttttcct ttgaaaaaca cgataatacc 1800 
atggcgccta ttacggccta ctcccaacag acgcgaggcc tacttggctg catcatcact 1860 
agcctcacag gccgggacag gaaccaggtc gagggggagg tccaagtggt ctccaccgca 1920 
acacaatctt tcctggcgac ctgcgtcaat ggcgtgtgtt ggactgtcta tcatggtgcc 1980 
ggctcaaaga cccttgccgg cccaaagggc ccaatcaccc aaatgtacac caatgtggac 2040 
caggacctcg tcggctggca agcgcccccc ggggcgcgtt ccttgacacc atgcacctgc 2100 
ggcagctcgg acctttactt ggtcacgagg catgccgatg tcattccggt gcgccggcgg 2160 
ggcgacagca gggggagcct actctccccc aggcccgtct cctacttgaa gggctcttcg 2220 
ggcggtccac tgctctgccc ctcggggcac gctgtgggca tctttcgggc tgccgtgtgc 2280 
acccgagggg ttgcgaaggc ggtggacttt gtacccgtcg agtctatgga aaccactatg 2340 
cggtccccgg tcttcacgga caactcgtcc cctccggccg taccgcagac attccaggtg 2400 
gcccatctac acgcccctac tggtagcggc aagagcacta aggtgccggc tgcgtatgca 2460 
gcccaagggt ataaggtgct tgtcctgaac ccgtccgtcg ccgccaccct aggtttcggg 2520 
gcgtatatgt ctaaggcaca tggtatcgac cctaacatca gaaccggggt aaggaccatc 2580 
accacgggtg cccccatcac gtactccacc tatggcaagt ttcttgccga cggtggttgc 2640 
tctgggggcg cctatgacat cataatatgt gatgagtgcc actcaactga ctcgaccact 2700 
atcctgggca tcggcacagt cctggaccaa gcggagacgg ctggagcgcg actcgtcgtg 2760 
ctcgccaccg ctacgcctcc gggatcggtc accgtgccac atccaaacat cgaggaggtg 2820 
gctctgtcca gcactggaga aatccccttt tatggcaaag ccatccccat cgagaccatc 2880 
aaggggggga ggcacctcat tttctgccat tccaagaaga aatgtgatga gctcgccgcg 2940 
aagctgtccg gcctcggact caatgctgta gcatattacc ggggccttga tgtatccgtc 3000 
ataccaacta gcggagacgt cattgtcgta gcaacggacg ctctaatgac gggctttacc 3060 
ggcgatttcg actcagtgat cgactgcaat acatgtgtca cccagacagt cgacttcagc 3120 
ctggacccga ccttcaccat tgagacgacg accgtgccac aagacgcggt gtcacgctcg 3160 
cagcggcgag gcaggactgg taggggcagg atgggcattt acaggtttgt gactccagga 3240 
gaacggccct cgggcatgtt cgattcctcg gttctgtgcg agtgctatga cgcgggctgt 3300 
gcttggtacg agctcacgcc cgccgagacc tcagttaggt tgcgggctta cctaaacaca 3360 
ccagggttgc ccgtctgcca ggaccatctg gagttctggg agagcgtctt tacaggcctc 3420 
acccacatag acgcccattt cttgtcccag actaagcagg caggagacaa cttcccctac 3480 
ctggtagcat accaggctac ggtgtgcgcc agggctcagg ctccacctcc atcgtgggac 3540 
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caaatgtgga 

tataggctgg 

atggcatgca 

gtcctagcag 

atcatcttgt 

gatgagatgg 

gaacaattca 

gctgctcccg 

tggaatttca 

gcgatagcat 

accctcctgt 

gcttctgctt 

aaggtgcttg 

tttaaggtca 

atcctctccc 

gtgggcccag 

ggtaaccacg 

cagatcctct 

gaggactgct 

acggtgttga 

gtccccttct 

caaaccacct 

atcgtggggc 

accacgggcc 

gctgctgagg 

accactgaca 

gatggggtgc 

acattcctgg 

ccggacgtag 

gctaagcgta 

ctgtctgcgc 

ctcatcgagg 

tcagaaaata 

agggaagtat 

cccatatggg 

tacgtccctc 

cctccacgga 

gagcrtcgcca 

acggcctctc 

tcctccatgc 

tctaccgtaa 

acaggcgccc 

agcaactctt 

ctgcggcaga 

gtgctcaagg 

gaagcctgta 

gacgtccgga 

ctggaagaca 

gtccaaccag 

gttcgtgtgt 

atgggctctt 

gcctggaaag 

acggtcactg 

cccgaagcca 

actaattcta 

accagctgcg 

aagctccagg 

gcggggaccc 

tctgcccccc 

tcctccaatg 

gaccccacca 

tcctggctag 

actcatttct 

atctacgggg 

catggcctta 

tcatgcctca 



agtgtctcat 
gagccgttca 
tgtcggctga 
ctctggccgc 
ccggaaagcc 
aagagtgcgc 
aacagaaggc 
tggtggaatc 
tcagcgggat 
cactgatggc 
ttaacatcct 
tcgtaggcgc 
tggatatttt 
tgagcggcga 
ctggcgccct 
gggagggggc 
tctcccccac 
ctagtcttac 
ccacgccatg 
ctgatttcaa 
tctcatgtca 
gcccatgtgg 
ctaggacctg 
cctgcacgcc 
agtacgtgga 
acgtaaagtg 
ggttgcacag 
tcgggctcaa 
cagtgctcac 
ggctggccag 
cttccttgaa 
ccaacctcct 
aggtagtaat 
ccgttccggc 
cacgcccgga 
cagtggtaca 
ggaagaggac 
caaagacctt 
ctgaccagcc 
ccccccttga 
gcgaggaggc 
tgatcacgcc 
tgctccgtca 
agaaggtcac 
agatgaaggc 
agctgacgcc 
acctatccag 
ctgagacacc 
agaagggggg 
gcgagaaaat 
catacggatt 
cgaagaaatg 
agaatgacat 
gacaggccat 
aagggcagaa 
gtaataccct 
actgcacgat 
aagaggacga 
ctggggaccc 
tgtcagtcgc 
ccccccttgc 
gcaacatcat 
tctccatcct 
cctgttactc 
gcgcattttc 
ggaaacttgg 



acggctaaag 
aaacgaggtt 
cctggaggtc 
gtattgcctg 
ggccatcatt 
ctcacacctc 
aatcgggttg 
caagtggcgg 
acaatattta 
attcacagcc 

ggggggatgg 

cggcatcgct 
ggcaggttat 
gatgccctcc 
agtcgtcggg 
tgtgcagtgg 
gcactatgtg 
catcactcag 
ctccggctcg 
gacctggctc 
acgtgggtac 
agcacagatc 
tagtaacacg 
ctccccggcg 
ggttacgcgg 
cccgtgtcag 
gtacgctcca 
tcaatacctg 
ttccatgctc 
gggatctccc 
ggcaacatgc 
gtggcggcag 
tttggactct 
ggagatcctg 
ttacaaccct 
cgggtgtcca 
ggttgtcctg 
cggcagctcc 
ctccgacgac 
gggggagccg 
tagtgaggac 
atgcgctgcg 
ccacaacttg 
ctttgacaga 
gaaggcgtcc 
cccacattcg 
caaggccgtt 
aattgacacc 
ccgcaagcca 
ggccctttac 
ccaatactct 
ccctatgggc 
ccgtgttgag 
aaggtcgctc 
ctgcggctat 
cacatgttac 
gctcgtatgc 
ggcgagccta 
gcccaaacca 
gcacgatgca 
gcgggctgcg 
catgtatgcg 
tctagctcag 
cattgagcca 
actccatagt 
ggtaccgccc 



cctacgctgc 

actaccacac 

gtcacgagca 

acaacaggca 

cccgacaggg 

ccttacatcg 

ctgcaaacag 

accctcgaag 

gcaggcttgt 

tctatcacca 

gtggccgccc 

ggagcggctg 

ggagcagggg 

accgaggacc 

gtcgtgtgcg 

atgaaccggc 

cctgagagcg 

ctgctgaaga 

tggctaagag 

cagtccaagc 

aagggagtct 

accggacatg 

tggcatggaa 

ccaaattatt 

gtgggggatt 

gttccggccc 

gcgtgcaaac 

gttgggtcac 

accgacccct 

ccctccttgg 

actacccgtc 

gagatgggcg 

ttcgagccgc 

cggaggtcca 

ccactgttag 

ttgccgcctg 

tcagaatcta 

gaatcgtcgg 

ggcgacgcgg 

ggggatcccg 

gtcgtctgct 

gaggaaacca 

gtctatgcta 

ctgcaggtcc 

acagttaagg 

gccagatcta 

aaccacatcc 

accatcatgg 

gctcgcctta 

gatgtggtct 

cctggacagc 

ttcgcatatg 

gagtcaatct 

acagagcggc 

cgccggtgcc 

ttgaaggccg 

ggagacgacc 

cgggccttca 

gaatacgact 

tctggcaaaa 

tgggagacag 

cccaccttgt 

gaacaacttg 

cttgacctac 

tactctccag 

ttgcgagtct 



acgggccaac 

accccataac 

cctgggtgct 

gcgtggtcat 

aagtccttta 

aacagggaat 

ccaccaagca 

ccttctgggc 

ccactctgcc 

gcccgctcac 

aacttgctcc 

ttggcagcat 

tggcaggcgc 

tggttaacct 

cagcgatact 

tgatagcgtt 

acgctgcagc 

ggcttcacca 

atgtttggga 

tcctgccgcg 

ggcggggcga 

tgaaaaacgg 

cattccccat 

ctagggcgct 

tccactacgt 

ccgaattctt 

ccctcctacg 

agctcccatg 

cccacattac 

ccagctcatc 

atgactcccc 

ggaacatcac 

tccaagcgga 

ggaaattccc 

agtcctggaa 

ccaaggcccc 

ccgtgtcttc 

ccgtcgacag 

gatccgacgt 

atctcagcga 

gctcgatgtc 

agctgcccat 

caacatctcg 

tggacgacca 

ctaaacttct 

aatttggcta 

gctccgtgtg 

caaaaaatga 

tcgtattccc 

ccaccctccc 

gggtcgagtt 

acacccgctg 

accaatgttg 

tttacatcgg 

gcgcgagcgg 

ctgcggcctg 

ttgtcgttat 

cggaggctat 

tggagttgat 

gggtgtacta 

ctagacacac 

gggcaaggat 

aaaaagccct 

ctcagatcat 

gtgagatcaa 

ggagacatcg 



gcccctgctg 3600 
caaatacatc 3660 
ggtaggcgga 3720 
tgtgggcagg 3780 
ccgggagttc 3840 
gcagetcgcc 3900 
agcggaggct 3960 
gaagcatatg 4020 
tggcaacccc 4080 
cacccaacat 4140 
tcccagcgct 4200 
aggccttggg 4260 
gctcgtggcc 4320 
actccctgct 4380 
gcgtcggcac 4440 
cgcttcgcgg 4500 
acgtgtcact 4560 
gtggatcaac 4620 
ttggatatgc 4680 
attgccggga 4740 
cggcatcatg 4800 
ttccatgagg 4860 
taacgcgtac 4920 
gtggcgggtg 4980 
gacgggcatg 5040 
cacagaagtg 5100 
ggaggaggtc 5160 
cgagcccgaa 5220 
ggcggagacg 5280 
agctagccag 5340 
ggacgctgac 5400 
ccgcgtggag 5460 
ggaggatgag 5520 
tcgagcgatg 5580 
ggacccggac 5640 
tccgatacca 5700 
tgccttggcg 5760 
cggcacggca 5820 
tgagtcgtac 5880 
cgggtcttgg 5940 
ctacacatgg 6000 
caatgcactg 6060 
cagcgcaagc 6120 
ctaccgggac 6180 
atccgtggag 6240 
tggggcaaag 6300 
gaaggacttg 6360 
ggttttctgc 6420 
agatttgggg 6480 
tcaggccgtg 6540 
cctggtgaat 6600 
ttttgactca 6660 
tgacttggcc 6720 
gggccccctg 6780 
tgtactgacg 6840 
tcgagctgcg 6900 
ctgtgaaagc 6960 
gactagatac 7020 
aacatcatgc 7080 
tctcacccgt 7140 
tccagtcaat 7200 
gatcctgatg 7260 
agattgtcag 7320 
tcaacgactc 7380 
tagggtggct 7440 
ggccagaagt 7500 
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gtccgcgcta ggctactgtc ccaggggggg 

aactgggcag taaggaccaa gctcaaactc 

ttatccagct ggttcgttgc tggttacagc 

gcccgacccc gctggttcat gtggtgccta 

ctactcccca accgatgaac ggggagctaa 

tttccctttt tttttttctt tttttttttt 

tttttcctct ttttttcctt ttctttcctt 

tagctgtgaa aggtccgtga gccgcttgac 
agatcaagt 



agggctgcca cttgtggcaa gtacctcttc 7560 
actccaatcc cggctgcgtc ccagttggat 7620 
gggggagaca tatatcacag cctgtctcgt 7680 
ctcctacttt ctgtaggggt aggcatctat 7740 
acactccagg ccaataggcc atcctgtttt 7800 
tttttttttt tttttttttt ttctcctttt 7860 
tggtggctcc atcttagccc tagtcacggc 7920 
tgcagagagt gctgatactg gcctctctgc 7980 

7989 
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<210> 5 
<211> B649 
<212> DNA 

<213> Hepatitis C Virus 



10 



15 



20 



30 



35 



40 



45 



50 



<400> 5 

gccagccccc 

tcttcacgca 

cccccctccc 

gacgaccggg 

gcgagactgc 

gtgcttgoga 

ctcaaagaaa 

acgcaggttc 

caatcggctg 

ttgtcaagac 

cgtggctggc 

gaagggactg 

ctcctgccga 

cggctacctg 

tggaagccgg 

ccgaactgtt 

atggcgatgc 

actgtggccg 

ttgctgaaga 

ctcccgattc 

cagaccacaa 

aacgttactg 

tccaccatat 

acgagcattc 

gtgaaggaag 

tgcaggcagc 

taagatacac 

gaaagagtca 

gtaccccatt 

tcgaggttaa 

cacgataata 

ctgatactct 

ttacaatatt 

gttcgggggg 

tttaccatca 

ataaccaaag 

cggaaggttg 

ggtacgtacg 

gaccttgcgg 

tggggggcag 

agggggaggg 

ctcgcgccta 

agcctcacag 

acacaatctt 

ggctcaaaga 

caggacctcg 

ggcagctcgg 

ggcgacagca 

ggcggtccac 

acccgagggg 

cggtccccgg 

gcccatctac 

gcccaagggt 

gcgtatatgt 

accacgggtg 

tctgggggcg 

atcctgggca 

ctcgccaccg 

gctctgtcca 



gattgggggc 
gaaagcgtct 
gggagagcca 
tcctttcttg 
tagccgagta 
gtgccccggg 
aaccaaacgt 
tccggcogct 
ctctgatgcc 
cgacctgtcc 
cacgacgggc 
gctgctattg 
gaaagtatcc 
cccattcgac 
tcttgtcgat 
cgccaggctc 
ctgcttgccg 
gctgggtgtg 
gcttggcggc 
gcagcgcatc 
cggtttccct 
gccgaagccg 
tgccgtcttt 
ctaggggtct 
cagttcctct 
ggaacccccc 
ctgcaaaggc 
aatggctctc 
gtatgggatc 
aaaacgtcta 
ccatggaccg 
tgaccttgtc 
ttatcaccag 
gccgcgatgc 
ccaaaatctt 
tgccgtactt 
ctgggggtca 
tttatgacca 
tggcagttga 
acaccgcggc 
agatacatct 
ttacggccta 
gccgggacag 
tcctggcgac 
cccttgccgg 
tcggctggca 
acctttactt 
gggggagcct 
tgctctgccc 
ttgcgaaggc 
tcttcacgga 
acgcccctac 
ataaggtgct 
ctaaggcaca 
cccccatcac 
cctatgacat 
tcggcacagt 
ctacgcctcc 
gcactggaga 



gacactccac 
agccatggcg 
tagtggtctg 
gatcaacccg 
gtgttgggtc 
aggtctcgta 
aacaccaacg 
tgggtggaga 
gccgtgttcc 
ggtgccctga 
gttccttgcg 
ggcgaagtgc 
atcatggctg 
caccaagcga 
caggatgatc 
aaggcgcgca 
aatatcatgg 
gcggaccgct 
gaatgggctg 
gccttctatc 
ctagcgggat 
cttggaataa 
tggcaatgtg 
ttcccctctc 
ggaagcttct 
acctggcgac 
ggcacaaccc 
ctcaagcgta 
tgatctgggg 
ggccccccga 
ggagatggca 
accgcactat 
ggccgaggca 
cgtcatcctc 
gctcgccata 
cgtgcgcgca 
ttatgtccaa 
tctcacccca 
gcccgtcgtc 
gtgtggggac 
gggaccggca 
ctcccaacag 
gaaccaggtc 
ctgcgtcaat 
cccaaagggc 
agcgcccccc 
ggtcacgagg 
actctccccc 
ctcggggcac 
ggtggacttt 
caactcgtcc 
tggtagcggc 
tgtcctgaac 
tggtatcgac 
gtactccacc 
cataatatgt 
cctggaccaa 
gggatcggtc 
aatccccttt 



catagatcac 
ttagtatgag 
cggaaccggt 
ctcaatgcct 
gcgaaaggcc 
gaccgtgcac 
ggcgcgccat 
ggctattogg 
ggctgtcagc 
atgaactgca 
cagctgtgct 
cggggcagga 
atgcaatgcg 
aacatcgcat 
tggacgaaga 
tgcccgacgg 
tggaaaatgg 
atcaggacat 
accgcttcct 
gccttcttga 
caattccgcc 
ggccggtgtg 
agggcccgga 
gccaaaggaa 
tgaagacaaa 
aggtgcctct 
cagtgccacg 
ttcaacaagg 
cctcggtgca 
accacgggga 
gcatcgtgcg 
aagctgttcc 
cacttgcaag 
ctcacgtgcg 
ctcggtccac 
cacgggctca 
atggctctca 
ctgcgggact 
ttctctgata 
atcatcttgg 
gacagccttg 
acgcgaggcc 
gagggggagg 
ggcgtgtgtt 
ccaatcaccc 
ggggcgcgtt 
catgccgatg 
aggcccgtct 
gctgtgggca 
gtacccgtcg 
cctccggccg 
aagagcacta 
ccgtccgtcg 
cctaacatca 
tatggcaagt 
gatgagtgcc 
gcggagacgg 
accgtgccac 
tatggcaaag 



tcccctgtga 
tgtcgtgcag 
gagtacaccg 
ggagatttgg 
ttgtggtact 
catgagcacg 
gattgaacaa 
ctatgactgg 
gcaggggcgc 
ggacgaggca 
cgacgttgtc 
tctcctgtca 
gcggctgcat 
cgagcgagca 
gcatcagggg 
cgaggatctc 
ccgcttttct 
agcgttggct 
cgtgctttac 
cgagttcttc 
cctctccctc 
cgtttgtcta 
aacctggccc 
tgcaaggtct 
caacgtctgt 
gcggccaaaa 
ttgtgagttg 
ggctgaagga 
catgctttac 
cgtggttttc 
gaggcgcggt 
tcgctaggct 
tgtggatccc 
cgatccaccc 
tcatggtgct 
ttcgtgcatg 
tgaagttggc 
gggcccacgc 
tggagaccaa 
gcctgcccgt 
aagggcaggg 
tacttggctg 
tccaagtggt 
ggactgtcta 
aaatgtacac 
ccttgacacc 
tcattccggt 
cctacttgaa 
tctttcgggc 
agtctatgga 
taccgcagac 
aggtgccggc 
ccgccaccct 
gaaccggggt 
ttcttgccga 
actcaactga 
ctggagcgcg 
atccaaacat 
ccatccccat 



ggaactactg 
cctccaggac 
gaattgccag 
gcgtgccccc 
gcctgatagg 
aatcctaaac 
gatggattgc 
gcacaacaga 
ccggttcttt 
gcgcggctat 
actgaagcgg 
tctcaccttg 
acgcttgatc 
cgtactcgga 
ctcgcgccag 
gtcgtgaccc 
ggattcatcg 
acccgtgata 
ggtatcgccg 
tgagtttaaa 
ccccccccct 
tatgttattt 
tgtcttcttg 
gttgaatgtc 
agcgaccctt 
gccacgtgta 
gatagttgtg 
tgcccagaag 
atgtgtttag 
ctttgaaaaa 
tttcgtaggt 
catatggtgg 
ccccctcaac 
agagctaatc 
ccaggctggt 
catgctggtg 
cgcactgaca 
gggcctacga 
ggttatcacc 
ctccgcccgc 
gtggcgactc 
catcatcact 
ctccaccgca 
tcatggtgcc 
caatgtggac 
atgcacctgc 
gcgccggcgg 
gggctcttcg 
tgccgtgtgc 
aaccactatg 
attccaggtg 
tgcgtatgca 
aggtttcggg 
aaggaccatc 
cggtggttgc 
ctcgaccact 
actcgtcgtg 
cgaggaggtg 
cgagaccatc 



60 

120 

180 

240 

300 

360 

420 

480 

540 

600 

660 

720 

780 

840 

900 

960 

1020 

1080 

1140 

1200 

1260 

1320 

1380 

1440 

1500 

1560 

1620 

1680 

1740 

1B0O 

I860 

1920 

1980 

2040 

2100 

2160 

2220 

2280 

2340 

2400 

2460 

2520 

2580 

2640 

2700 

2760 

2820 

2880 

2940 

3000 

3060 

3120 

3180 

3240 

3300 

3360 

3420 

3480 

3540 
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aaggggggga ggcacctcat tttctgccat tccaagaaga aatgtgatga gctcgccgcg 3600 
aagctgtccg gcctcggact caatgctgta gcatattacc ggggccttga tgtatccgtc 3660 
ataccaacta gcggagacgt cattgtcgta gcaacggacg ctctaatgac gggctttacc 3720 
ggcgatttcg actcagtgat cgactgcaat acatgtgtca cccagacagt cgacttcagc 37 BO 
ctggacccga ccttcaccat tgagacgacg accgtgccac aagacgcggt gtcacgctcg 3840 
cagcggcgag gcaggactgg taggggcagg atgggcattt acaggtttgt gactccagga 3900 
gaacggccct cgggcatgtt cgattcctcg gttctgtgcg agtgctatga cgcgggctgt 3960 
gcttggtacg agctcacgcc cgccgagacc tcagttaggt tgcgggctta cctaaacaca 4020 
ccagggttgc ccgtctgcca ggaccatctg gagttctggg agagcgtctt tacaggcctc 4080 
acccacatag acgcccattt cttgtcccag actaagcagg caggagacaa cttcccctac 4140 
ctggtagcat accaggctac ggtgtgcgcc agggctcagg ctccacctcc atcgtgggac 4200 
caaatgtgga agtgtctcat acggctaaag cctacgctgc acgggccaac gcccctgctg 4260 
tataggctgg gagccgttca aaacgaggtt actaccacac accccataac caaatacatc 4320 
atggcatgca tgtcggctga cctggaggtc gtcacgagca cctgggtgct ggtaggcgga 4380 
gtcctagcag ctctggccgc gtattgcctg acaacaggca gcgtggtcat tgtgggcagg 4440 
atcatcttgt ccggaaagcc ggccatcatt cccgacaggg aagtccttta ccgggagttc 4500 
gatgagatgg aagagtgcgc ctcacacctc ccttacatcg aacagggaat gcagctcgcc 4560 
gaacaattca aacagaaggc aatcgggttg ctgcaaacag ccaccaagca agcggaggct 4620 
gctgctcccg tggtggaatc caagtggcgg accctcgaag ccttctgggc gaagcatatg 4680 
tggaatttca tcagcgggat acaatattta gcaggcttgt ccactctgcc tggcaacccc 4740 
gcgatagcat cactgatggc attcacagcc tctatcacca gcccgctcac cacccaacat 4800 
accctcctgt ttaacatcct ggggggatgg gtggccgccc aacttgctcc tcccagcgct 4860 
gcttctgctt tcgtaggcgc cggcatcgct ggagcggctg ttggcagcat aggccttggg 4920 
aaggtgcttg tggatatttt ggcaggttat ggagcagggg tggcaggcgc gctcgtggcc 4980 
tttaaggtca tgagcggcga gatgccctcc accgaggacc tggttaacct actccctgct 5040 
atcctctccc ctggcgccct agtcgtcggg gtcgtgtgcg cagcgatact gcgtcggcac 5100 
gtgggcccag gggagggggc tgtgcagtgg atgaaccggc tgatagcgtt cgcttcgcgg 5160 
ggtaaccacg tctcccccac gcactatgtg cctgagagcg acgctgcagc acgtgtcact 5220 
cagatcctct ctagtcttac catcactcag ctgctgaaga ggcttcacca gtggatcaac 5280 
gaggactgct ccacgccatg ctccggctcg tggctaagag atgtttggga ttggatatgc 5340 
acggtgttga ctgatttcaa gacctggctc cagtccaagc tcctgccgcg attgccggga 5400 
gtccccttct tctcatgtca acgtgggtac aagggagtct ggcggggcga cggcatcatg 5460 
caaaccacct gcccatgtgg agcacagatc accggacatg tgaaaaacgg ttccatgagg 5520 
atcgtggggc ctaggacctg tagtaacacg tggcatggaa cattccccat taacgcgtac 5580 
accacgggcc cctgcacgcc ctccccggcg ccaaattatt ctagggcgct gtggcgggtg 5640 
gctgctgagg agtacgtgga ggttacgcgg gtgggggatt tccactacgt gacgggcatg 5700 
accactgaca acgtaaagtg cccgtgtcag gttccggccc ccgaattctt cacagaagtg 5760 
gatggggtgc ggttgcacag gtacgctcca gcgtgcaaac ccctcctacg ggaggaggtc 5820 
acattcctgg tcgggctcaa tcaatacctg gttgggtcac agctcccatg cgagcccgaa 5880 
ccggacgtag cagtgctcac ttccatgctc accgacccct cccacattac ggcggagacg 5940 
gctaagcgta ggctggccag gggatctccc ccctccttgg ccagctcatc agctagccag 6000 
ctgtctgcgc cttccttgaa ggcaacatgc actacccgtc atgactcccc ggacgctgac 6060 
ctcatcgagg ccaacctcct gtggcggcag gagatgggcg ggaacatcac ccgcgtggag 6120 
tcagaaaata aggtagtaat tttggactct ttcgagccgc tccaagcgga ggaggatgag 6180 
agggaagtat ccgttccggc ggagatcctg cggaggtcca ggaaattccc tcgagcgatg 6240 
cccatatggg cacgcccgga ttacaaccct ccactgttag agtcctggaa ggacccggac 6300 
tacgtccctc cagtggtaca cgggtgtcca ttgccgcctg ccaaggcccc tccgatacca 6360 
cctccacgga ggaagaggac ggttgtcctg tcagaatcta ccgtgtcttc tgccttggcg 6420 
gagctcgcca caaagacctt cggcagctcc gaatcgtcgg ccgtcgacag cggcacggca 6480 
acggcctctc ctgaccagcc ctccgacgac ggcgacgcgg gatccgacgt tgagtcgtac 6540 
tcctccatgc ccccccttga gggggagccg ggggatcccg atctcagcga cgggtcttgg 6600 
tctaccgtaa gcgaggaggc tagtgaggac gtcgtctgct gctcgatgtc ctacacatgg 6660 
acaggcgccc tgatcacgcc atgcgctgcg gaggaaacca agctgcccat caatgcactg 6720 
agcaactctt tgctccgtca ccacaacttg gtctatgcta caacatctcg cagcgcaagc 6780 
ctgcggcaga agaaggtcac ctttgacaga ctgcaggtcc tggacgacca ctaccgggac 6B40 
gtgctcaagg agatgaaggc gaaggcgtcc acagttaagg ctaaacttct atccgtggag 6900 
gaagcctgta agctgacgcc cccacattcg gccagatcta aatttggcta tggggcaaag 6960 
gacgtccgga acctatccag caaggccgtt aaccacatcc gctccgtgtg gaaggacttg 7020 
ctggaagaca ctgagacacc aattgacacc accatcatgg caaaaaatga ggttttctgc 7080 
gtccaaccag agaagggggg ccgcaagcca gctcgcctta tcgtattccc agatttgggg 7140 
gttcgtgtgt gcgagaaaat ggccctttac gatgtggtct ccaccctccc tcaggccgtg 7200 
atgggctctt catacggatt ccaatactct cctggacagc gggtcgagtt cctggtgaat 7260 
gcctggaaag cgaagaaabg ccctatgggc ttcgcatatg acacccgctg ttttgactca 7320 
acggtcactg agaatgacat ccgtgttgag gagtcaatct accaatgttg tgacttggcc 7380 
cccgaagcca gacaggccat aaggtcgctc acagagcggc tttacatcgg gggccccctg 7440 
actaattcta aagggcagaa ctgcggctat cgccggtgcc gcgcgagcgg tgtactgacg 7500 
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accagctgcg gtaataccct cacatgttac 
aagctccagg actgcacgat gctcgtatgc 
gcggggaccc aagaggacga ggcgagccta 
tctgcccccc ctggggaccc gcccaaacca 
tcctccaatg tgtcagtcgc gcacgatgca 
gaccccacca ccccccttgc gcgggctgcg 
tcctggctag gcaacatcat catgtatgcg 
actcatttct tctccatcct tctagctcag 
atctacgggg cctgttactc cattgagcca 
catggcctta gcgcattttc actccatagt 
tcatgcctca ggaaacttgg ggtaccgccc 
gtccgcgcta ggctactgtc ccaggggggg 
aactgggcag taaggaccaa gctcaaactc 
ttatccagct ggttcgttgc tggttacagc 
gcccgacccc gctggttcat gtggtgccta 
ctactcccca accgatgaac ggggagctaa 
tttccctttt tttttttctt tttttttttt 
tttttcctct ttttttcctt ttctttcctt 
tagctgtgaa aggtccgtga gccgcttgac 
agatcaagt 
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ttgaaggccg ctgcggcctg Ccgagctgcg 7560 

ggagacgacc ttgtcgttat ctgtgaaagc 7620 

cgggccttca cggaggctat gactagatac 7680 

gaatacgact tggagttgat aacatcatgc 7740 

tctggcaaaa gggtgtacta tctcacccgt 7800 

tgggagacag ctagacacac tccagtcaat 7860 

cccaccttgt gggcaaggat gatcctgatg 7920 

gaacaacttg aaaaagccct agattgtcag 7980 

cttgacctac ctcagatcat tcaacgactc 8040 

tactctccag gtgagatcaa tagggtggct 8100 

ttgcgagtct ggagacatcg ggccagaagt 8160 

agggctgcca cttgtggcaa gtacctcttc 8220 

actccaatcc cggctgcgtc ccagttggat 8280 

gggggagaca tatatcacag cctgtctcgt 8340 

ctcctacttt ctgtaggggt aggcatctat 8400 

acactccagg ccaataggcc atcctgtttt 8460 

tttttttttt tttttttttt ttctcctttt 8520 

tggtggctcc atcttagccc tagtcacggc 8580 

tgcagagagt gctgatactg gcctctctgc 8640 

8649 
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<210> 6 
<211> 8001 
<212> DMA 

<213> Hepatitia C Virus 
<400> 6 

gccagccccc gattgggggc gacactccac 
tcttcacgca gaaagcgtct agccatggcg 
cccccctccc gggagagcca tagtggtctg 
gacgaccggg tcctttcttg gatcaacccg 
gcgagactgc tagccgagta gtgttgggtc 
gtgcttgcga gtgccccggg aggtctcgta 
ctcaaagaaa aaccaaacgt aacaccaacg 
acgcaggttc tccggccgct tgggtggaga 
caatcggctg ctctgatgcc gccgtgttcc 
ttgtcaagac cgacctgtcc ggtgccctga 
cgtggctggc cacgacgggc gttccttgcg 
gaagggactg gctgctattg ggcgaagtgc 
ctcctgccga gaaagtatcc atcatggctg 
cggctacctg cccattcgac caccaagcga 
tggaagccgg tcttgtcgat caggatgatc 
ccgaactgtt cgccaggctc aaggcgcgca 
atggcgatgc ctgcttgccg aatatcatgg 
actgtggccg gctgggtgtg gcggaccgct 
ttgctgaaga gcttggcggc gaatgggctg 
ctcccgattc gcagcgcatc gccttctatc 
cagaccacaa cggtttccct ctagcgggat 
aacgttactg gccgaagccg cttggaataa 
tccaccatat tgccgtcttt tggcaatgtg 
acgagcattc ctaggggtct ttcccctctc 
gtgaaggaag cagttcctct ggaagcttct 
tgcaggcagc ggaacccccc acctggcgac 
taagatacac ctgcaaaggc ggcacaaccc 
gaaagagtca aatggctctc ctcaagcgta 
gtaccccatt gtatgggatc tgatctgggg 
tcgaggttaa aaaacgtcta ggccccccga 
cacgataata ccatggcgcc tattacggcc 
tgcatcatca ctagcctcac aggccgggac 
gtctccaccg caacacaatc tttcctggcg 
tatcatggtg ccggctcaaa gacccttgcc 
accaatgtgg accaggacct cgtcggctgg 
ccatgcacct gcggcagctc ggacctttac 
gtgcgccggc ggggcgacag cagggggagc 
aagggctctt cgggcggtcc actgctctgc 
gctgccgtgt gcacccgagg ggttgcgaag 
gaaaccacta tgcggtcccc ggtcttcacg 
acattccagg tggcccatct acacgcccct 
gctgcgtatg cagcccaagg gtataaggtg 
ctaggtttcg gggcgtatat gtctaaggca 
gtagggacca tcaccacggg tgcccccatc 
gacggtggtt gctctggggg cgcctatgac 
gactcgacca ctatcctggg catcggcaca 
cgactcgtcg tgctcgccac cgctacgcct 
atcgaggagg tggctctgtc cagcactgga 
atcgcgacca tcaagggggg gaggcacctc 
gagctcgccg cgaagctatc cggcctcgga 
gatgtatccg tcataccaac tagcggagac 
acgggcttta ccggcgattt cgactcagtg 
gtcgacttca gcctggaccc gaccttcacc 
gtgtcacgct cgcagcggcg aggcaggact 
gtgactccag gagaacggcc ctcgggcatg 
gacgcgggct gtgcttggta cgagctcacg 
tacctaaaca caccagggct gcccgtctgc 
tttacaggcc tcacccacat agacgcccat 
aacttcccct acctggtagc ataccaggct 



catagatcac tcccctgtga ggaactactg €0 
ttagtatgag tgtcgtgcag cctccaggac 120 
cggaaccggt gagtacaccg gaattgccag 160 
ctcaatgcct ggagatttgg gcgtgccccc 240 
gcgaaaggcc ttgtggtact gcctgatagg 300 
gaccgtgcac catgagcacg aatcctaaac 360 
ggcgcgccat gattgaacaa gatggattgc 420 
ggctattcgg ctatgactgg gcacaacaga 460 
ggctgtcagc gcaggggcgc ccggttcttt 540 
atgaactgca ggacgaggca gcgcggctat 600 
cagctgtgct cgacgttgtc actgaagcgg 660 
cggggcagga tctcctgtca tctcaccttg 720 
atgcaatgeg gcggctgcat acgcttgatc 760 
aacatcgcat cgagcgagca cgtactcgga 840 
tggacgaaga gcatcagggg ctcgcgccag 900 
tgcccgacgg cgaggatctc gtcgtgaccc 960 
tggaaaatgg ccgcttttct ggattcatcg 1020 
atcaggacat agcgttggct acccgtgata 1080 
accgcttcct cgtgctttac ggtatcgccg 1140 
gccttcttga cgagttcttc tgagtttaaa 1200 
caattccgcc cctctccctc ccccccccct 1260 
ggccggtgtg cgtttgtcta tatgttattt 1320 
agggcccgga aacctggccc tgtcttcttg 1380 
gccaaaggaa tgcaaggtct gttgaatgtc 1440 
tgaagacaaa caacgtctgt agcgaccctt 1500 
aggtgcctct gcggccaaaa gccacgtgta 1560 
cagtgccacg ttgtgagttg gatagttgtg 1620 
ttcaacaagg ggctgaagga tgcccagaag 1680 
cctcggtgca catgctttac atgtgtttag 1740 
accacgggga cgtggttttc ctttgaaaaa 1800 
tactcccaac agacgcgagg cctacttggc 1860 
aggaaccagg tcgaggggga ggtccaagtg 1920 
acctgcgtca atggcgtgtg ttggactgtc 1980 
ggcccaaagg gcccaatcac ccaaatgtac 2040 
caagcgcccc ccggggcgcg ttccttgaca 2100 
ttggtcacga ggcatgccga tgtcattccg 2160 
ctactctccc ccaggcccgt ctcctacttg 2220 
ccctcggggc atgctgtggg catctttcgg 2280 
gcggtggact ttgtacccgt cgagtctatg 2340 
gacaactcgt cccctccggc cgtaccgcag 2400 
actggtagcg gcaagagcac taaggtgccg 2460 
cttgtcctga acccgtccgt cgccgccacc 2520 
catggtatcg accctaacat cagaaccggg 2580 
acgtactcca cctatggcaa gtttcttgcc 2640 
atcataatat gtgatgagtg ccactcaact 2700 
gtcctggacc aagcggagac ggctggagcg 2760 
ccgggatcgg tcaccgtgcc acatccaaac 2820 
gaaatcccct tttatggcaa agccatcccc 2880 
attttctgcc . attccaagaa gaaatgtgat 2940 
ctcaatgctg tagcatatta ccggggcctt 3000 
gtcatvgtcg tagcaacgga cgctctaatg 3060 
atcgactgca atacatgtgt cacccagaca 3120 
attgagacga cgaccgtgcc acaagacgcg 3180 
ggtaggggca ggatgggcat ttacaggttt 3240 
ttcgattcct cggttctgtg cgagtgctat 3300 
cccgccgaga cctcagttag gttgcgggct 3360 
caggaccatc tggagttctg ggagagcgtc 3420 
ttcttgtccc agactaggca ggcaggagac 3480 
acggtgtgcg ccagggctca ggctccacct 3540 
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ccatcgtggg accaaatgtg ggagtgtctc atacggctaa agcctacgct gcacgggcca 3600 
acgcccctgc tgtataggct gggagccgtt caaaacgagg ttactaccac acaccccata 3660 
accaaataca tcatggcatg catgtcggct gacctggagg tcgtcacgag cacctgggtg 3720 
ctggtaggcg gagtcctagc agctctggcc gcgtattgcc tgacaacagg cagcgtggtc 3760 
attgtgggca ggatcatctt gtccggaaag ccggccatca ttcccgacag ggaagtcctt 3840 
taccgggagt tcgatgagat ggaagagtgc gcctcacacc tcccttacat cgaacaggga 3900 
atgcagctcg ccgaacaatt caaacagaag gcaatcgggt tgctgcaaac agccaccaag 3960 
caagcggagg ctgctgctcc cgtggtggaa tccaagtggc ggaccctcga agccttctgg 4020 
gcgaagcata tgtggaattt catcagcggg atacaatatt tagcaggctt gtccactctg 4080 
cctggcaacc ccgcgatagc atcactgatg gcattcacag cctctatcac cagcccgctc 4140 
accacccaac ataccctcct gtttaacatc ctggggggat gggtggccgc ccaacttgct 4200 
cctcccagcg ctgcttctgc tttcgtaggc gccggcatcg ctggagcggc tgttggcagc 4260 
ataggccttg ggaaggtgct tgtggatatt ttggcaggtt atggagcagg ggtggcaggc 4320 
gcgctcgtgg cctttaaggt catgagcggc gagatgccct ccaccgagga cctggttaac 4380 
ctactccctg ctatcctctc ccctggcgcc ctagtcgtcg gggtcgtgtg cgcagcgata 4440 
ctgcgtcggc acgtgggccc aggggagggg gctgtgcagt ggatgaaccg gctgatagcg 4500 
ttcgcttcgc ggggtaacca cgtctccccc acgcactatg tgtctgagag cgacgctgca 4560 
gcacgtgtca ctcagatcct ctctagtctt accatcactc agctgctgaa gaggcttcac 4620 
cagtggatca acgaggactg ctccacgcca tgctccggct cgtggctaag agatgtttgg 4680 
gattggatat gcacggtgtt gactgatttc aagacctggc tccagtccaa gctcctgccg 4740 
cgattgccgg gagtcccctt cttctcatgt caacgtgggt acaagggagt ctggcggggc 4800 
gacggcatca tgcaaaccac ctgcccatgt ggagcacaga tcaccggaca tgtgaaaaac 4860 
ggttccatga ggatcgtggg gcctaggacc tgtagtaaca cgtggcatgg aacattcccc 4920 
attaacgcgt acaccacggg cccctgcacg ccctccccgg cgccaaatta ttctagggcg 4980 
ctgtggcggg tggctgctga ggagtacgtg gaggttacgc gggtggggga tttccactac 5040 
gtgacgggca tgaccactga caacgtaaag tgcccgtgtc aggttccggc ccccgaattc 5100 
ttcacagaag tggatggggt gcggttgcac aggtacgctc cagcgtgcaa acccctccta 5160 
cgggaggagg tcacattcct ggtcgggctc aatcaatacc tggttgggtc acagctccca 5220 
tgcgggcccg aaccggacgt agcagtgctc acttccatgc tcaccgaccc ctcccacatt 5280 
acggcggaga cggctaagcg taggctggcc aggggatctc ccecctcctt ggccagctca 5340 
tcagctagcc agctgtctgc gccttccttg aaggcaacat gcactacccg tcatgactcc 5400 
ccggacgctg acctcatcga ggccaacctc ctgtggcggc aggagatggg cgggaacatc 5460 
acccgcgtgg agtcagaaaa taaggtagta attttggact ctttcgagcc gctccaagcg 5520 
gaggaggatg agagggaagt atccgttccg gcggagatcc tgcggaggtc caggaaattc 5580 
cctcgagcga tgcccatatg ggcacgcccg gattacaacc ctccactgtt agagtcctgg 5640 
aaggacccgg actacgtccc tccagtggta cacgggtgtc cattgccgcc tgccaaggcc 5700 
cctccgatac cacctccacg gagggagagg acggttgtcc tgtcagaatc taccgtgtct 5760 
tctgccttgg cggagctcgc cacaaagacc ttcggcagct ccgaatcgtc ggccgtcgac 5820 
agcggcacgg caacggcctc tcctgaccag ccctccgacg acggcgacgc gggatccgac 5880 
gttgagtcgt actcctccat gccccccctt gagggggagc cgggggatcc cgatctcagc 5940 
gacgggtctt ggtctaccgt aagcgaggag gctagtgagg acgtcgtctg ctgctcgatg 6000 
tcctacacat ggacaggcgc cctgatcacg ccatgcgctg cggaggaaac caagctgccc 6060 
gtcaatgcac tgagcaactc tttgctccgt caccacaact tggtctatgc tacaacatct 6120 
cgcagcgcaa gcctgcggca gaagaaggtc acctttgaca gactgcaggt cctggacgac 6160 
cactaccggg acgtgctcaa ggagatgaag gcgaaggcgt ccacagttaa ggctaaactt 6240 
ctatccgtgg aggaagcctg taagctgacg cccccacatt cggccagatc taaatttggc 6300 
tatggggcaa aggacgtccg gaacctatcc agcaaggccg ttaaccacat ccgctccgtg 6360 
tggaaggact tgctggaaga cactgagaca ccaattgaca ccaccatcat ggcaaaaaat 6420 
gaggttttct gcgtccaacc agagaagggg ggccgcaagc cagctcgcct tatcgtattc 6480 
ccagatttgg gggttcgtgt gtgcgagaaa atggcccttt acgatgtggt ctccaccctc 6540 
cctcaggccg tgatgggctc ttcatacgga ttccaatact ctcctggaca gcgggtcgag 6600 
ttcctggtga atgcctggaa agcgaagaaa tgccctatgg gcttcgcata tgacacccgc 6660 
tgttttgact caacggtcac tgagaatgac atccgtgttg aggagtcaat ctaccaatgt 6720 
tgtgacttgg cccccgaagc cagacaggcc ataaggtcgc tcacagagcg gctttacatc 67 BO 
gggggccccc tgactaattc taaagggcag aactgcggct atcgccggtg ccgcgcgagc 6640 
ggtgtactga cgaccagctg cggtaatacc ctcacatgtt atttgaaggc cgctgcggcc 6900 
tgtcgagctg cgaagctcca ggactgcacg atgctcgtat gcggagacga ccttgtcgtt 6960 
atctgtgaaa gcgcggggac ccaagaggac gaggcgagcc tacgggcctt cacggaggct 7020 
atgactagat actctgcccc ccctggggac ccgcccaaac cagaatacga cttggagttg 7080 
ataacatcat gctcctccaa tgtgtcagtc gcgcacgatg catctggcaa aagggtgtac 7140 
tatctcaccc gtgaccccac cacccccctt gcgcgggctg cgtgggagac agctagacac 7200 
actccagtca attcctggct aggcaacatc atcatgtatg cgcccacctt gtgggcaagg 7260 
atgatcctga tgactcattt cttctccatc cttctagctc aggaacaact tgaaaaagcc 7320 
ctagattgtc agatctacgg ggcctgttac tccattgagc cacttgacct acctcagatc 7380 
attcaacgac tccatggcct tagcgcattt tcactccata gttactctcc aggtgagatc 7440 
aatagggtgg cttcatgcct caggaaactt ggggtaccgc ccttgcgagt ctggagacat 7500 
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cgggccagaa gtgtccgcgc taggctactg 
aagtacctct tcaactgggc agtaaggacc 
tcccagttgg atttatccag ctggttcgtt 
agcctgtctc gtgcccgacc ccgctggttc 
gtaggcatct atctactccc caaccgatga 
ccatcctgtt tttttccctt tttttttttc 
ttttctcctt tttttttcct ctttttttcc 
cctagtcacg gctagctgtg aaaggtccgt 
tggcctctct gcagatcaag t 



tcccaggggg ggagggctgc cacttgtggc 7560 
aagctcaaac tcactccaat cccggctgcg 7620 
gctggttaca gcgggggaga catatatcac 7680 
atgtggtgcc tactcctact ttctgtaggg 7740 
acggggagct aaacactcca ggccaatagg 7800 
tttttttttt tttttttttt tttttttttt 7860 
ttttctttcc tttggtggct ccatcttagc 7920 
gagccgcttg actgcagaga gtgctgatac 7980 

8001 
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<210> 7 
<211> 11076 
<212> DKA 

<213> Hepatitis C Virus 
<400> 7 

gccagccccc gattgggggc gacactccac 
tcttcacgca gaaagcgtct agccatggcg 
cccccctccc gggagagcca tagtggtctg 
gacgaccggg tcctttcttg gatcaacccg 
gcgagactgc tagcegagta gtgttgggtc 
gtgcttgcga gtgccccggg aggtctcgta 
ctcaaagaaa aaccaaacgt aacaccaacg 
acgcaggttc tccggccgct tgggtggaga 
caatcggctg ctctgatgcc gccgtgttcc 
ttgtcaagac cgacctgtcc -ggtgccctga 
cgtggctggc cacgacgggc gttccttgcg 
gaagggactg gctgctattg ggcgaagtgc 
ctcctgccga gaaagtatcc atcatggctg 
cggctacctg cccattcgac caccaagcga 
tggaagccgg tcttgtcgat caggatgatc 
ccgaactgtt cgccaggctc aaggcgcgca 
atggcgatgc ctgcttgccg aatatcatgg 
actgtggccg gctgggtgtg gcggaccgct 
ttgctgaaga gcttggcggc gaatgggctg 
ctcccgattc gcagcgcatc gccttctatc 
cagaccacaa cggtttccct ctagcgggat 
aacgttactg gccgaagccg cttggaataa 
tccaccatat tgccgtcttt tggcaatgtg 
acgagcattc ctaggggtct ttcccctctc 
gtgaaggaag cagttcctct ggaagcttct 
tgcaggcagc ggaacccccc acctggcgac 
taagatacac ctgcaaaggc ggcacaaccc 
gaaagagtca aatggctctc ctcaagcgta 
gtaccccatt gtatgggatc tgatctgggg 
tcgaggttaa aaaacgtcta ggccccccga 
cacgataata ccatgggcac gaatcctaaa 
cgccgcccac aggacgtcaa gttcccgggc 
ttgccgcgca ggggccccag gttgggtgtg 
caacctcgtg gaaggcgaca acctatcccc 
gctcagcccg ggtacccctg gcccctctat 
ctcctgtcac cccgtggctc tcggcctagt 
cgcaatttgg gtaaggtcat cgataccctc 
attccgctcg tcggcgcccc cctagggggc 
gttctggagg acggcgtgaa ctatgcaaca 
ttccttttgg ctttgctgtc ctgtttgacc 
gtatccggag tgtaccatgt cacgaacgac 
gcggacatga tcatgcatac ccccgggtgc 
cgctgctggg tagcgctcac tcccacgctc 
acgatacgac gccatgtcga tttgctcgtt 
gtgggagatc tctgcggatc tgttttcctc 
cggcacgaga cagtacagga ctgcaattgc 
cgtatggctt gggatatgat gatgaactgg 
ttactccgga tcccacaagc tgtcgtggat 
gcgggccttg cctactattc catggtgggg 
ctctttgccg gcgttgacgg gggaacctat 
ctcgggatta cgtccctctt ttcacccggg 
aacggcagct ggcacatcaa caggactgcc 
ttccttgctg cgctgttcta cgtgcacaag 
gccagctgca gccccatcga cgcgttcgct 
tcacacagct cggaccagag gccttattgt 
gtacccgcgg cgcaggtgtg tggtccagtg 
gggacgaccg accggttcgg cgtccctacg 
ctgcttctta acaacacgcg gccgccgcaa 
agcactgggt tcaccaagac gtgcgggggc 



catagatcac tcccctgtga ggaactactg 60 
ttagtatgag tgtcgtgcag cctccaggac 120 
cggaaccggt gagtacaccg gaattgccag 180 
ctcaatgcct ggagatttgg gcgtgecccc 240 
gcgaaaggcc ttgtggtact gcctgatagg 300 
gaccgtgcac catgagcacg aatcctaaac 360 
ggcgcgccat gattgaacaa gatggattgc 420 
ggctattcgg ctatgactgg gcacaacaga 480 
ggctgtcagc gcaggggcgc ccggttcttt 540 
atgaactgca ggacgaggca gcgcggctat 600 
cagctgtgct cgacgttgtc actgaagcgg 660 
cggggcagga tctcctgtca tctcaccttg 720 
atgcaatgcg gcggctgcat acgcttgatc 760 
aacatcgcat cgagcgagca cgtactcgga 840 
tggaegaaga gcatcagggg ctcgcgccag 900 
tgcccgacgg cgaggatctc gtcgtgaccc 960 
tggaaaatgg ccgcttttct ggattcatcg 1020 
atcaggacat agcgttggct acccgtgata 1080 
accgcttcct cgtgctttac ggtatcgccg 1140 
gccttcttga cgagttcttc tgagtttaaa 1200 
caattccgcc cctctccctc ccccccccct 1260 
ggccggtgtg cgtttgtcta tatgttattt 1320 
agggcccgga aacctggccc tgtcttcttg 1380 
gccaaaggaa tgcaaggtct gttgaatgtc 1440 
tgaagacaaa caacgtctgt agcgaccctt 1500 
aggtgcctct gcggccaaaa gccacgtgta 1560 
cagtgccacg ttgtgagttg gatagttgtg 1620 
ttcaacaagg ggctgaagga tgcccagaag 1680 
cctcggtgca catgctttac atgtgtttag 1740 
accacgggga cgtggttttc ctttgaaaaa 1800 
cctcaaagaa aaaccaaacg taacaccaac 1860 
ggtggtcaga tcgtcggtgg agtttacctg 1920 
cgcgcgacta ggaagacttc cgagcggtcg 1980 
aaggctcgcc agcccgaggg tagggcctgg 2040 
ggcaatgagg gcttggggtg ggcaggatgg 2100 
tggggcccca cggacccccg gcgtaggtcg 2160 
acgtgcggct tcgccgatct catggggtac 2220 
gctgccaggg ccctggcgca tggcgtccgg 2280 
gggaatctgc ccggttgctc cttttctatc .2340 
atcccagctt ccgcttatga agtgcgcaac 2400 
tgctccaacg caagcattgt gtatgaggca 2460 
gtgccctgcg ttcgggagaa caactcctcc 2520 
gcggccagga acgctagcgt ccccactacg 2580 
ggggcggctg ctctctgctc cgctatgtac 2640 
gtcgcccagc tgttcacctt ctcgcctcgc 2700 
tcaatatatc ccggccacgt gacaggtcac 2760 
tcacctacag cagccctagt ggtatcgcag 2820 
atggtggcgg gggcccattg gggagtccta 2880 
aactgggcta aggttctgat tgtgatgcta 2940 
gtgacagggg ggacgatggc caaaaacacc 3000 
tcatcccaga aaatccagct tgtaaacacc 3060 
ctgaactgca atgactccct caacactggg 3120 
ttcaactcat ctggatgccc agagcgcatg 3180 
caggggtggg ggcccatcac ttacaatgag 3240 
tggcactacg caccccggcc gtgcggtatc 3300 
tactgcttca ccccaagccc tgtcgtggtg 3360 
tacagttggg gggagaatga gacggacgtg 3420 
ggcaactggt ttggctgtac atggatgaat 3480 
cccccgtgta acatcggggg gatcggcaat 3540 
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aaaaccttga cctgccccac ggactgcttc cggaagcacc ccgaggccac ttacaccaag 3600 
tgtggttcgg ggccttggtt gacacccaga tgcttggtcc actacccata caggctttgg 3660 
cactacccct gcactgtcaa ctttaccatc ttcaaggtta ggatgtacgt ggggggagtg 3720 
gagcacaggc tcgaagccgc atgcaattgg actcgaggag agcgttgtaa cctggaggac 3780 
agggacagat cagagcttag cccgctgctg ctgtctacaa cggagtggca ggtattgccc 3840 
tgttccttca ccaccctacc ggctctgtcc actggtttga tccatctcca tcagaacgtc 3900 
gtggacgtac aatacctgta cggtataggg tcggcggttg tctcctttgc aatcaaatgg 3960 
gagtatgtcc tgttgctctt ccttcttctg gcggacgcgc gcgtctgtgc ctgcttgtgg 4020 
atgatgctgc tgatagctca agctgaggcc gccctagaga acctggtggt cctcaacgcg 4080 
gcatccgtgg ccggggcgca tggcattctc tccttcctcg tgttcttctg tgctgcctgg 4140 
tacatcaagg gcaggctggt ccctggggcg gcatatgccc tctacggcgt atggccgcta 4200 
ctcctgctcc tgctggcgtt accaccacga gcatacgcca tggaccggga gatggcagca 4260 
tcgtgcggag gcgcggtttt cgtaggtctg atactcttga ccttgtcacc gcactataag 4320 
ctgttcctcg ctaggctcat atggtggtta caatatttta tcaccagggc cgaggcacac 4380 
ttgcaagtgt ggatcccccc cctcaacgtt cgggggggcc gcgatgccgt catcctcctc 4440 
acgtgcgcga tccacccaga gctaatcttt accatcacca aaatcttgct cgccatactc 4500 
ggtccactca tggtgctcca ggctggtata accaaagtgc cgtacttcgt gcgcgcacac 4560 
gggctcattc gtgcatgcat gctggtgcgg aaggttgctg ggggtcatta tgtccaaatg 4620 
gctctcatga agttggccgc actgacaggt acgtacgttt atgaccatct caccccactg 4680 
cgggactggg cccacgcggg cctacgagac cttgcggtgg cagttgagcc cgtcgtcttc 4740 
tctgatatgg agaccaaggt tatcacctgg ggggcagaca ccgcggcgtg tggggacatc 4800 
atcttgggcc tgcccgtctc cgcccgcagg gggagggaga tacatctggg accggcagac 4860 
agccttgaag ggcaggggtg gcgactcctc gcgcctatta cggcctactc ccaacagacg 4920 
cgaggcctac ttggctgcat catcactagc ctcacaggcc gggacaggaa ccaggtcgag 4980 
ggggaggtcc aagtggtctc caccgcaaca caatctttcc tggcgacctg cgtcaatggc 5040 
gtgtgttgga ctgtctatca tggtgccggc tcaaagaccc ttgccggccc aaagggccca 5100 
atcacccaaa tgtacaccaa tgtggaccag gacctcgtcg gctggcaagc gccccccggg 5160 
gcgcgttcct tgacaccatg cacctgcggc agctcggacc tttacttggt cacgaggcat 5220 
gccgatgtca ttccggtgcg ccggcggggc gacagcaggg ggagcctact ctcccccagg 5280 
cccgtctcct acttgaaggg ctcttcgggc ggtccactgc tctgcccctc ggggcatgct 5340 
gtgggcatct ttcgggctgc cgtgtgcacc cgaggggttg cgaaggcggt ggactttgta 5400 
cccgtcgagt ctatggaaac cactatgcgg tccccggtct tcacggacaa ctcgtcccct 5460 
ccggccgtac cgcagacatt ccaggtggcc catctacacg cccctactgg tagcggcaag 5520 
agcactaagg tgccggctgc gtatgcagcc caagggtata aggtgcttgt cctgaacccg 5580 
tccgtcgccg ccaccctagg tttcggggcg tatatgtcta aggcacatgg tatcgaccct 5640 
aacatcagaa ccggggtagg gaccatcacc acgggtgccc ccatcacgta ctccacctat 5700 
ggcaagtttc ttgccgacgg tggttgetct gggggcgcct atgacatcat aatatgtgat 5760 
gagtgccact caactgactc gaccactatc ctgggcatcg gcacagtcct ggaccaagcg 5820 
gagacggctg gagcgcgact cgtcgtgctc gccaccgcta cgcctccggg atcggtcacc 5880 
gtgccacatc caaacatcga ggaggtggct ctgtccagca ctggagaaat ccccttttat 5940 
ggcaaagcca tccccatcgc gaccatcaag ggggggaggc acctcatttt ctgccattcc 6000 
aagaagaaat gtgatgagct cgccgcgaag ctatccggcc tcggactcaa tgctgtagca 6060 
tattaccggg gccttgatgt atccgtcata ccaactagcg gagacgtcat tgtcgtagca 6120 
acggacgctc taatgacggg ctttaccggc gatttcgact cagtgatcga ctgcaataca 6180 
tgtgtcaccc agacagtcga cttcagcctg gacccgacct tcaccattga gacgacgacc 6240 
gtgccacaag acgcggtgtc acgctcgcag cggcgaggca ggactggtag gggcaggatg 6300 
ggcatttaca ggtttgtgac tccaggagaa cggccctcgg gcatgttcga ttcctcggtt 6360 
ctgtgcgagt gctatgacgc gggctgtgct tggtacgagc tcacgcccgc cgagacctca 6420 
gttaggttgc gggcttacct aaacacacca gggctgcccg tctgccagga ccatctggag 6480 
ttctgggaga gcgtctttac aggcctcacc cacatagacg cccatttctt gtcccagact 6540 
aggcaggcag gagacaactt cccctacctg gtagcatacc aggctacggt gtgcgccagg 6600 
gctcaggctc cacctccatc gtgggaccaa atgtgggagt gtctcatacg gctaaagcct 6660 
acgctgcacg ggccaacgcc cctgctgtat aggctgggag ccgttcaaaa cgaggttact 6720 
accacacacc ccataaccaa atacatcatg gcatgcatgt cggctgacct ggaggtcgtc 6780 
acgagcacct gggtgctggt aggcggagtc ctagcagctc tggccgcgta ttgcctgaca 6840 
acaggcagcg tggtcattgt gggcaggatc atcttgtccg gaaagccggc catcattccc 6900 
gacagggaag tcctttaccg ggagttcgat gagatggaag agtgcgcctc acacctccct 6960 
tacatcgaac agggaatgca gctcgccgau caattcaaac agaaggcaat cgggttgctg 7020 
caaacagcca ccaagcaagc ggaggctgct gctcccgtgg tggaatccaa gtggcggacc 7080 
ctcgaagcct tctgggcgaa gcatatgtgg aatttcatca gcgggataca atatttagca 7140 
ggcttgtcca ctctgcctgg caaccccgcg atagcatcac tgatggcatt cacagcctct 7200 
atcaccagcc cgctcaccac ccaacatacc ctcctgttta acatcctggg gggatgggtg 7260 
gccgcccaac ttgctcctcc cagcgctgct tctgctttcg taggcgccgg catcgctgga 7320 
gcggctgttg gcagcatagg ccttgggaag gtgcttgtgg atattttggc aggttatgga 7380 
gcaggggtgg caggcgcgct cgtggccttt aaggtcatga gcggcgagat gccctccacc 7440 
gaggacctgg ttaacctact ccctgctatc ctctcccctg gcgccctagt cgtcggggtc 7500 
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gtgtgcgcag cgatactgcg tcggcacgtg ggcccagggg agggggctgt gcagtggatg 7560 
aaccggctga tagcgttcgc ttcgcggggt aaccacgtct cccccacgca ctatgtgtct 7620 
gagagcgacg ctgcagcacg tgtcactcag atcctctcta gtcttaccat cactcagctg 7680 
ctgaagaggc ttcaccagtg gatcaacgag gactgctcca cgccatgctc cggctcgtgg 7740 
ctaagagatg tttgggattg gatatgcacg gtgttgactg atttcaagac ctggctccag 7800 
tccaagctcc tgccgcgatt gccgggagtc cccttcttct catgtcaacg tgggtacaag 7860 
ggagtctggc ggggcgacgg catcatgcaa accacctgcc catgtggagc acagatcacc 7920 
ggacatgtga aaaacggttc catgaggatc gtggggccta ggacctgtag taacacgtgg 7980 
catggaacat tccccattaa cgcgtacacc acgggcccct gcacgccctc cccggcgcca 8040 
aattattcta gggcgctgtg gcgggtggct gctgaggagt acgtggaggt tacgcgggtg 8100 
ggggatttcc actacgtgac gggcatgacc actgacaacg taaagtgccc gtgtcaggtt 8160 
ccggcccccg aattcttcac agaagtggat ggggtgcggt tgcacaggta cgctccagcg 8220 
tgcaaacccc tcctacggga ggaggtcaca ttcctggtcg ggctcaatca atacctggtt 8280 
gggtcacagc tcccatgcgg gcccgaaccg gacgtagcag tgctcacttc catgctcacc 6340 
gacccctccc acattacggc ggagacggct aagcgtaggc tggccagggg atctcccccc 6400 
tccttggcca gctcatcagc tagccagctg tctgcgcctt ccttgaaggc aacatgcact 8460 
acccgtcatg actccccgga cgctgacctc atcgaggcca acctcctgtg gcggcaggag 8520 
atgggcggga acatcacccg cgtggagtca gaaaataagg tagtaatttt ggactctttc 6580 
gagccgctcc aagcggagga ggatgagagg gaagtatccg ttccggcgga gatcctgcgg 8640 
aggtccagga aattccctcg agcgatgccc atatgggcac gcccggatta caaccctcca 8700 
ctgttagagt cctggaagga cccggactac gtccctccag tggtacacgg gtgtccattg 8760 
ccgcctgcca aggcccctcc gataccacct ccacggaggg agaggacggt tgtcctgtca 8820 
gaatctaccg tgtcttctgc cttggcggag ctcgccacaa agaccttcgg cagctccgaa 8880 
tcgtcggccg tcgacagcgg cacggcaacg gcctctcctg accagccctc cgacgacggc 6940 
gacgcgggat ccgacgttga gtcgtactcc tccatgcccc cccttgaggg ggagccgggg 9000 
gatcccgatc tcagcgacgg gtcttggtct accgtaagcg aggaggctag tgaggacgtc 9060 
gtctgctgct cgatgtccta cacatggaca ggcgccctga tcacgccatg cgctgcggag 9120 
gaaaccaagc tgcccgtcaa tgcactgagc aactctttgc tccgtcacca caacttggtc 9180 
tatgctacaa catctcgcag cgcaagcctg cggcagaaga aggtcacctt tgacagactg 9240 
caggtcctgg acgaccacta ccgggacgtg ctcaaggaga tgaaggcgaa ggcgtccaca 9300 
gttaaggcta aacttctatc cgtggaggaa gcctgtaagc tgacgccccc acattcggcc 9360 
agatctaaat ttggctatgg ggcaaaggac gtccggaacc tatccagcaa ggccgttaac 9420 
cacatccgct ccgtgtggaa ggacttgctg gaagacactg agacaccaat tgacaccacc 9480 
atcatggcaa aaaatgaggt tttctgcgtc caaccagaga aggggggccg caagccagct 9540 
cgccttatcg tattcccaga tttgggggtt cgtgtgtgcg agaaaatggc cctttacgat 9600 
gtggtctcca ccctccctca ggccgtgatg ggctcttcat acggattcca atactctcct 9660 
ggacagcggg tcgagttcct ggtgaatgcc tggaaagcga agaaatgccc tatgggcttc 9720 
gcatatgaca cccgctgttt tgactcaacg gtcactgaga atgacatccg tgttgaggag 9780 
tcaatctacc aatgttgtga cttggccccc gaagccagac aggccataag gtcgctcaca 9840 
gagcggcttt acatcggggg ccccctgact aattctaaag ggcagaactg cggctatcgc 9900 
cggtgccgcg cgagcggtgt actgacgacc agctgcggta ataccctcac atgttatttg 9960 
aaggccgctg cggcctgtcg agctgcgaag ctccaggact gcacgatgct cgtatgcgga 10020 
gacgaccttg tcgttatctg tgaaagcgcg gggacccaag aggacgaggc gagcctacgg 10080 
gccttcacgg aggctatgac tagatactct gccccccctg gggacccgcc caaaccagaa 10140 
tacgacttgg agttgataac atcatgctcc tccaatgtgt cagtcgcgca cgatgcatct 10200 
ggcaaaaggg tgtactatct cacccgtgac cccaccaccc cccttgcgcg ggctgcgtgg 10260 
gagacagcta gacacactcc agtcaattcc tggctaggca acatcatcat gtatgcgccc 1032O 
accttgtggg caaggatgat cctgatgact catttcttct ccatccttct agctcaggaa 10380 
caacttgaaa aagccctaga ttgtcagatc tacggggcct gttactccat tgagccactt 1044O 
gacctacctc agatcattca acgactccat ggccttagcg cattttcact ccatagttac 10500 
tctccaggtg agatcaatag ggtggcttca tgcctcagga aacttggggt accgcccttg 10560 
cgagtctgga gacatcgggc cagaagtgtc cgcgctaggc tactgtccca gggggggagg 10620 
gctgccactt gtggcaagta cctcttcaac tgggcagtaa ggaccaagct caaactcact 10680 
ccaatcccgg ctgcgtccca gttggattta tccagctggt tcgttgctgg ttacagcggg 10740 
ggagacatat atcacagcct gtctcgtgcc cgaccccgct ggttcatgtg gtgcctactc 10800 
ctactttctg taggggtagg catctatcta ctccccaacc gatgaacggg gagctaaaca 10860 
ctccaggcca ataggccatc ctgttttttt cccttttttt ttttcttttt tttttttttt 10920 
tttttttttt tttttttttc tccttttttt ttcctctttt tttccttttc tttcctttgg 10980 
tggctccatc ttagccctag tcacggctag ctgtgaaagg tccgtgagcc gcttgactgc 11040 
agagagtgct gatactggcc tctctgcaga tcaagt 11076 
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gccagccccc gattggggge gacactccac 
tcttcacgca gaaagcgtct agccatggcg 
cccccctcce gggagagcca tagtggtctg 
gacgaccggg tcctttcttg gatcaacccg 
gcgagactgc tagccgagta gtgttgggtc 
gtgcttgcga gtgccccggg aggtctcgta 
ctcaaagaaa aaccaaacgt aacaccaacg 
acgcaggttc tccggccgct tgggtggaga 
caatcggctg ctctgatgcc gccgtgttcc 
ttgtcaagac cgacctgtcc ggtgccctga 
cgtggctggc cacgacgggc gttccttgcg 
gaagggactg gctgctattg ggcgaagtgc 
ctcctgccga gaaagtatcc atcatggctg 
cggctacctg cccattcgac caccaagcga 
tggaagccgg tcttgtcgat caggatgatc 
ccgaactgtt cgccaggctc aaggcgcgca 
atggcgatgc ctgcttgccg aatatcatgg 
actgtggccg gctgggtgtg gcggaccgct 
ttgctgaaga gcttggcggc gaatgggctg 
ctcccgattc gcagcgcatc gccttctatc 
cagaccacaa cggtttccct ctagcgggat 
aacgttactg gocgaagccg cttggaataa 
tccaccatat tgccgtcttt tggcaatgtg 
acgagcattc ctaggggtct ttcccctctc 
gtgaaggaag cagttcctct ggaagcttct 
tgcaggcagc ggaacccccc acctggcgac 
taagatacac ctgcaaaggc ggcacaaccc 
gaaagagtca aatggctctc ctcaagcgta 
gtaccccatt gtatgggatc tgatctgggg 
tcgaggttaa aaaacgtcta ggccccccga 
cacgataata ccatggcgcc tattacggcc 
tgcatcatca ctagcctcac aggccgggac 
gtctccaccg caacacaatc tttcctggcg 
tatcatggtg ccggctcaaa gacccttgcc 
accaatgtgg accaggacct cgtcggctgg 
ccatgcacct gcggcagctc ggacctttac 
gtgcgccggc ggggcgacag cagggggagc 
aagggctctt cgggcggtcc actgctctgc 
gctgccgtgt gcacccgagg ggttgcgaag 
gaaaccacta tgcggtcccc ggtcttcacg 
acattccagg tggcccatct acacgcccct 
gctgcgtatg cagcccaagg gtataaggtg 
ctaggtttcg gggcgtatat gtctaaggca 
gtaaggacca tcaccacggg tgcecccatc 
gacggtggtt gctctggggg cgcctatgac 
gactcgacca ctatcctggg catcggcaca 
cgactcgtcg tgctcgccac cgctacgcct 
atcgaggagg tggctctgtc cagcactgga 
atcgagacca tcaagggggg gaggcacctc 
gagctcgccg cgaagctgtc cggcctcgga 
gatgtatccg tcataccaac r.agcggagac 
acgggcttta ccggtgactt cgactcagtg 
gtcgacttca gcctggaccc gaccttcacc 
gtgtcacgct cgcagcggcg aggcaggact 
gtgactccag gagaacggcc ctcgggcatg 
gacgcgggct gtgcttggta cgagctcacg 
tacctaaaca caccagggtt gcccgtctgc 
tttacaggcc tcacccacat agacgcccat 
aacttcccct acctggtagc ataccaggct 
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catagatcac tcccctgtga ggaactactg 60 
ttagtatgag tgtcgtgcag cctccaggac 120 
cggaaccggt gagtacaccg gaattgccag 180 
ctcaatgcct ggagatttgg gcgtgccccc 240 
gcgaaaggcc ttgtggtact gcctgatagg 300 
gaccgtgcac catgagcacg aatcctaaac 360 
ggcgcgccat gattgaacaa gatggattgc 420 
ggctattcgg ctatgactgg gcacaacaga 480 
ggctgtcagc gcaggggcgc ccggttcttt 540 
atgaactgca ggacgaggca gcgcggctat 600 
cagctgtgct cgacgttgtc actgaagcgg 660 
cggggcagga tctcctgtca tctcaccttg 720 
atgcaatgcg gcggctgcat acgcttgatc 780 
aacatcgcat cgagcgagca cgtactcgga 840 
tggacgaaga gcatcagggg ctcgcgccag 900 
tgcccgacgg cgaggatctc gtcgtgaccc 960 
tggaaaatgg ccgcttttct ggattcatcg 1020 
atcaggacat agcgttggct acccgtgata 1080 
accgcttcct cgtgctttac ggtatcgccg 1140 
gccttcttga cgagttcttc tgagtttaaa 1200 
caattccgcc cctctccctc ccccccccct 1260 
ggccggtgtg cgtttgtcta tatgttattt 1320 
agggcccgga aacctggccc tgtcttcttg 1380 
gccaaaggaa tgcaaggtct gttgaatgtc 1440 
tgaagacaaa caacgtctgt agcgaccctt 1500 
aggtgcctct gcggccaaaa gccacgtgta 1560 
cagtgccacg ttgtgagttg gatagttgtg 1620 
ttcaacaagg ggctgaagga tgcccagaag 1660 
cctcggtgca catgctttac atgtgtttag 1740 
accacgggga cgtggttttc ctttgaaaaa 1800 
tactcccaac agacgcgagg cctacttggc 1860 
aggaaccagg tcgaggggga ggtccaagtg 1920 
acctgcgtca atggcgtgtg ttggactgtc 1980 
ggcccaaagg gcccaatcac ccaaatgtac 2040 
caagcgcccc ccggggcgcg ttccttgaca 2100 
ttggtcacga ggcatgccga tgtcattccg 2160 
ctactctccc ccaggcccgt ctcctacttg 2220 
ccctcggggc acgctgtggg catctttcgg 2280 
gcggtggact ttgtacccgt cgagtctatg 2340 
gacaactcgt cccctccggc cgtaccgcag 2400 
actggtagcg gcaagagcac taaggtgccg 2460 
cttgtcctga acccgtccgt cgccgccacc 2520 
catggtatcg accctaacat cagaatcggg 2580 
acgtactcca cctatggcaa gtttcttgcc 2640 
atcataatat gtgatgagtg ccactcaact 2700 
gtcctggacc aagcggagac ggctggagcg 2760 
ccgggatcgg tcaccgtgcc acatccaaac 2820 
gaaatcccct tttatggcaa agccatcccc 2880 
attttctgcc attccaagaa gaaatgtgat 2940 
ctcaatgctg tagcatatta ccggggcctt 3000 
gtcattgtcg tagcaacgga cgctctaatg 3060 
atcgactgca atacatgtgt cacccagaca 3120 
attgagacga cgaccgtgcc acaagacgcg 3180 
ggtaggggca ggatgggcat ttacaggttt 3240 
ttcgattcct cggttctgtg cgagtgctat 3300 
cccgccgaga cctcagttag gttgcgggct 3360 
caggaccatc tggagttctg ggagagcgtc 3420 
ttcttgtccc agactaagca ggcaggagac 3480 
acggtgtgcg ccagggctca ggctccacct 3540 
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ccatcgtggg 
acgcccctgc 
accaaataca 
ctggtaggcg 
attgtgggca 
taccgggagt 
atgcagctcg 
caagcggagg 
gcgaagcata 
cctggcaacc 
accacccaac 
cctcccagcg 
ataggccttg 
gcgctcgtgg 
ctactccctg 
ctgcgtcggc 
ttcgcttcgc 
gcacgtgtca 
cagtggatca 
gattggatat 
cgattgccgg 
gacggcatca 
ggttccatga 
attaacgcgt 
ctgtggcggg 
gtgacgggca 
ttcacagaag 
cgggaggagg 
tgcgagcccg 
acggcggaga 
tcagctagcc 
ccggacgctg 
acccgcgtgg 
gaggaggatg 
cctcgagcga 
aaggacccgg 
cctccgatac 
tctgccttgg 
agcggcacgg 
gttgagtcgt 
gacgggtctt 
tcctacacat 
atcaatgcac 
cgcagcgcaa 
cactaccggg 
ctatccgtgg 
tatggggcaa 
tggaaggact 
gaggttttct 
ccagatttgg 
cctcaggccg 
ttcctggtga 
tgttttgact 
tgtgacttgg 
gggggccccc 
ggtgtactga 
tgtcgagctg 
atctgtgaaa 
atgactagat 
ataacatcat 
tatctcaccc 
actccagtca 
atgatcctga 
ctagattgtc 
attcaacgac 
aatagggtgg 



accaaatgtg 
tgtataggct 
tcatggcatg 
gagtcctagc 
ggatcatctt 
tcgatgagat 
ccgaacaatt 
ctgctgctcc 
tgtggaattt 
ccgcgatagc 
ataccctcct 
ctgcttctgc 
ggaaggtgct 
cctttaaggt 
ctatcctctc 
acgtgggccc 
ggggtaacca 
ctcagatcct 
acgaggactg 
gcacggtgtt 
gagtcccctt 
tgcaaaccac 
ggategtggg 
acaccacggg 
tggctgctga 
tgaccactga 
tggatggggt 
tcacattcct 
aaccggatgt 
cggctaagcg 
agctgtctgc 
acctcatcga 
agtcagaaaa 
agagggaagt 
tgcccatatg 
actacgtccc 
caccttcacg 
cggagctcgc 
caacggcctc 
actcctccat 
ggtctaccgt 
ggacaggcgc 
tgagcaactc 
gcctgcggca 
acgtgctcaa 
aggaagcctg 
aggacgtccg 
tgctggaaga 
gcgtccaacc 
gggttcgtgt 
tgatgggctc 
atgcctggaa 
caacggtcac 
cccccgaagc 
tgactaattc 
cgaccagctg 
cgaagctcca 
gcgcggggac 
actctgcccc 
gctcctccaa 
gtgaccccac 
attcctggct 
tgactcattt 
agatctacgg 
tccatggcct 
cttcatgcct 



gaagtgtctc 
gggagccgtt 
catgtcggct 
agctctggcc 
gtccggaaag 
ggaagagtgc 
caaacagaag 
cgtggtggaa 
catcagcggg 
atcactgatg 
gtttaacatc 
tttcgtaggc 
tgtggatatt 
catgagcggc 
ccctggcgcc 
aggggagggg 
cgtctccccc 
ctctagtctt 
ctccacgcca 
gactgatttc 
cttctcatgt 
ctgcccatgt 
gcctaggacc 
cccctgcacg 
ggagtacgtg 
cgacgtaaag 
gcggttgcac 
ggtcgggctc 
agcagtgctc 
taggctggcc 
gccttccttg 
ggccaacctc 
taaggtagta 
atccgttccg 
ggcacgcccg 
tccagtggta 
gaggaagagg 
cacagagacc 
tcctgaccag 
gccccccctt 
aagcgaggag 
cctgatcacg 
tttgctccgt 
gaagaaggtc 
ggagatgaag 
taagctgacg 
gaacctatcc 
cactgagaca 
agagaagggg 
gtgcgagaaa 
ttcatacgga 
agcgaagaaa 
tgagaatgac 
cagacaggcc 
taaagggcag 
cggtaatacc 
ggactgcacg 
ccaagaggac 
ccctggggac 
tgtqtcagtc 
cacccccctt 
aggcaacatc 
cttctccatc 
ggcctgttac 
tagcgcatct 
caggaaactt 



atacggctaa 
caaaacgagg 
gacctggagg 
gcgtattgcc 
ccggccatca 
gcctcacacc 
gcaatcgggt 
tccaagtggc 
atacaatatt 
gcattcacag 
ctggggggat 
gccggcatcg 
ttggcaggtt 
gagatgccct 
ctagtcgtcg 
gctgtgcagt 
acgcactatg 
accatcactc 
tgctccggct 
aagacctggc 
caacgtgggt 
ggggcacaga 
tgtagtaaca 
ccctccccgg 
gaggttacgc 
tgcccgtgtc 
aggtacgctc 
aatcaatacc 
acttccatgc 
aggggatctc 
aaggcaacat 
ctgtggcggc 
attttggact 
gcggagatcc 
gattacaacc 
cacgggtgtc 
acggttgtcc 
ttcggcagct 
ccctccgacg 
gagggggagc 
gctagtgagg 
ccatgcgctg 
caccacaact 
acctttgaca 
gcgaaggcgt 
cccccacatt 
agcaaggccg 
ccaattga ca 
ggccgcaagc 
atggcccttt 
ttccaatact 
tgccctatgg 
atccgtgttg 
ataaggtcgc 
aactgcggct 
ctcacatgtt 
atgctcgtat 
gaggcgagcc 
ccgcccaaac 
gcgcacgatg 
gcgcgggctg 
atcatgtatg 
cttctagctc 
tccattgagc 
tcactccata 
ggggtaccgc 



agcctacgct 
ttactaccac 
tcgtcacgag 
tgacaacagg 
ttcccgacag 
tcccttacat 
tgctgcaaac 
ggaccatcga 
tagcaggctt 
cctctatcac 
gggtggccgc 
ctggagcggc 
atggagcagg 
ccaccgagga 
gggtcgtgtg 
ggatgaaccg 
tgcctgagag 
agctgctgaa 
cgtggctaag 
tccagtccaa 
acaagggagt 
tcaccggaca 
cgtggcatgg 
cgccaaatta 
gggtggggga 
aggttccggc 
cagcgtgcaa 
tggttgggtc 
tcaccgaccc 
ctcccccctt 
gcactacccg 
aggagatggg 
ctttcgagcc 
tgcggaggtc 
ctccactgtt 
cattgccgcc 
tgtcagaatc 
ccgaatcgtc 
acggcgacgc 
cgggggatcc 
acgtcgtctg 
cggaggaaac 
tggtctatgc 
gactgcaggt 
ccacagttaa 
cggccagatc 
ttaaccacat 
ccaccatcat 
cagctcgcct 
acgatgtggt 
ctcctggaca 
gcttcgcata 
aggagtcaat 
tcacagagcg 
atcgccggtg 
acttgaaggc 
gcggagacga 
tacgggcctt 
cagaatacga 
catctggcaa 
cgtgggagac 
cgcccacctt 
aggaacaact 
cacttgacct 
gttactctcc 
ccttgcgagt 



gcacgggcca 
acaccccata 
cacctgggtg 
cagcgtggtc 
ggaagtcctt 
cgaacaggga 
agccaccaag 
agccttctgg 
gtccactctg 
cagcccgctc 
ccaacttgct 
tgttggcagc 
ggtggcaggc 
cctggttaac 
cgcagcgata 
gctgatagcg 
cgacgctgca 
gaggcttcac 
agatgtttgg 
gctcctgccg 
ctggcggggc 
tgtgaaaaac 
aacattcccc 
ttctagggcg 
tttccactac 
ccccgaattc 
acccctccta 
acagctccca 
ctcccacatt 
ggccagctca 
tcatgactcc 
cgggaacatc 
gctccaagcg 
caggaaattc 
agagtcctgg 
tgccaaggcc 
taccgtgtct 
ggccgtcgac 
gggatccgac 
cgatctcagc 
ctgctcgatg 
caagctgccc 
tacaacatct 
cctggacgac 
ggctaaactt 
taaatttggc 
ccgctccgtg 
ggcaaaaaat 
tatcgtattc 
ctccaccctc 
gcgggtcgag 
tgacacccgc 
ctaccaatgt 
gctttacatc 
ccgcgcgagc 
cgctgcggcc 
ccttgtcgtt 
cacggaggct 
cttggagttg 
aagggtgtac 
agctagacac 
gtgggcaagg 
tgaaaaagcc 
acctcagatc 
aggtgagatc 
ctggagacat 



3600 
3660 
3720 
3700 
3840 
3900 
3960 
4020 
4080 
4140 
4200 
4260 
4320 
4380 
4440 
4500 
4560 
4620 
4680 
4740 
4800 
4860 
4920 
4980 
5040 
5100 
5160 
5220 
5280 
5340 
5400 
5460 
5520 
5580 
5640 
5700 
5760 
5820 
5880 
5940 
6000 
6060 
6120 
6180 
6240 
6300 
6360 
6420 
6480 
6540 
6600 
6660 
6720 
6780 
6840 
6900 
6960 
7020 
7080 
7140 
7200 
7260 
7320 
7380 
7440 
7500 
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cgggccagaa gtgtccgcgc taggctactg 
aagtacctct tcaactgggc agtaaggacc 
tcccagttgg atttatccag ctggttcgtt 
agcctgtctc gtgcccgacc ccgctggttc 
gtaggcatct atctactccc caaccgatga 
ccatcctgtt tttttccctt tttttttttc 
ttttctcctt tttttttcct ctttttttcc 
cctagtcacg gctagctgtg aaaggtccgt 
tggcctctct gcagatcaag t 



tcccaggggg ggagggctgc cacttgtggc 7560 
aagctcaaac tcactccaat cccggctgcg 7620 
gctggttaca gcgggggaga catatatcac 7680 
atgtggtgcc tactcctact ttctgtaggg 7740 
acggggagct aaacactcca ggccaatagg 7 BOO 
tttttttttt tttttttttt tttttttttt 7860 
ttttctttcc tttggtggct ccatcttagc 7920 
gagccgcttg actgcagaga gtgctgatac 7980 

8001 
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<210> 9 
<211> 11076 
<212> DNA 

<213> Hepatitis C Virus 
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<400> 9 

gccagccccc 

tcttcacgca 

cccccctccc 

gacgaccggg 

gcgagactgc 

gtgcttgcga 

ctcaaagaaa 

acgcaggttc 

caatcggctg 

ttgtcaagac 

cgtggctggc 

gaagggactg 

ctcctgccga 

cggctacctg 

tggaagccgg 

ccgaactgtt 

atggcgatgc 

actgtggccg 

ttgctgaaga 

ctcccgattc 

cagaccacaa 

aacgttactg 

tccaccatat 

acgagcattc 

gtgaaggaag 

tgcaggcagc 

taagatacac 

gaaagagtca 

gtaccccatt 

tcgaggttaa 

cacgataata 

cgccgcccac 

ttgccgcgca 

caacctcgtg 

gctcagcccg 

ctcctgtcac 

cgcaatttgg 

attccgctcg 

gttctggagg 

ttccttttgg 

gtatccggag 

gcggacatga 

cgctgctggg 

acgatacgac 

gtgggagatc 

cggcacgaga 

cgtatggctt 

ttactccgga 

gcgggccttg 

ctctttgccg 

ctcgggatta 

aacggcagct 

ttccttgctg 

gccagctgca 

tcacacagct 

gtacccgcgg 

gggacgaccg 

ctgcttctta 

agcactgggt 



gattgggggc 
gaaagcgtct 
gggagagcca 
tcctttcttg 
tagccgagta 
gtgccccggg 
aaccaaacgt 
tccggccgct 
ctctgatgcc 
cgacctgtcc 
cacgacgggc 
gctgctattg 
gaaagtatcc 
cccattcgac 
tcttgtcgat 
cgccaggctc 
ctgcttgccg 
gctgggtgtg 
gcttggcggq 
gcagcgcatc 
cggtttccct 
gccgaagccg 
tgccgtcttt 
ctaggggtct 
cagttcctct 
ggaacccccc 
ctgcaaaggc 
aatggctctc 
gtatgggatc 
aaaacgtcta 
ccatgggcac 
aggacgtcaa 
ggggccccag 
gaaggcgaca 
ggtacccctg 
cccgtggctc 
gtaaggtcat 
tcggcgcccc 
acggcgtgaa 
ctttgctgtc 
tgtaccatgt 
tcatgcatac 
tagcgctcac 
gccatgtcga 
tctgcggatc 
cagtacagga 
gggatatgat 
tcccacaagc 
cctactattc 
gcgttgacgg 
cgtccctctt 
ggcacatcaa 
cgctgttcta 
gccccatcga 
cggaccagag 
cgcaggtgtg 
accggttcgg 
acaacacgcg 
tcaccaagac 



gacactccac 
agccatggcg 
tagtggtctg 
gatcaacccg 
gtgttgggtc 
aggtctcgta 
aacaceaacg 
tgggtggaga 
gccgtgttcc 
ggtgccetga 
gttccttgcg 
ggcgaagtgc 
atcatggctg 
caccaagcga 
caggatgatc 
aaggcgcgca 
aatatcatgg 
gcggaccgct 
gaatgggctg 
gccttctatc 
ctagcgggat 
cttggaataa 
tggcaatgtg 
ttcccctctc 
ggaagcttct 
acctggcgac 
ggcacaaccc 
ctcaagcgta 
tgatctgggg 
ggccccccga 
gaatcctaaa 
gttcccgggc 
gttgggtgtg 
acctatcccc 
gcccctctat 
tcggcctagt 
cgataccctc 
cctagggggc 
ctatgcaaca 
ctgtttgacc 
cacgaacgac 
ccccgggtgc 
tcccacgctc 
tttgctcgtt 
tgttttcctc 
ctgcaattgc 
gatgaactgg 
tgtcgtggat 
catggtgggg 
gggaacctat 
ttcacccggg 
caggactgcc 
cgtgcacaag 
cgcgttcgct 
gccttattgt 
tggtccagtg 
cgtccctacg 
gccgccgcaa 
gtgcgggggc 



catagatcac 
ttagtatgag 
cggaaccggt 
ctcaatgcct 
gcgaaaggcc 
gaccgtgcac 
ggcgcgccat 
ggctattcgg 
ggctgtcagc 
atgaaetgca 
cagctgtgct 
cggggcagga 
atgcaatgcg 
aacatcgcat 
tggacgaaga 
tgcccgacgg 
tggaaaatgg 
atcaggacat 
accgcttcct 
gccttcttga 
caattccgcc 
ggccggtgtg 
agggcccgga 
gccaaaggaa 
tgaagacaaa 
aggtgcctct 
cagtgccacg 
ttcaacaagg 
cctcggtgca 
accacgggga 
cctcaaagaa 
ggtggtcaga 
cgcgcgacta 
aaggctcgcc 
ggcaatgagg 
tggggcccca 
acgtgcggct 
gctgccaggg 
gggaatctgc 
atcccagctt 
tgctccaacg 
gtgccctgcg 
gcggccagga 
ggggcggctg 
gtcgcccagc 
tcaatatatc 
tcacctacag 
atggtggcgg 
aactgggcta 
gtgacagggg 
tcatcccaga 
ctgaactgca 
ttcaactcat 
caggggtggg 
tggcactacg 
tactgcttca 
tacagttggg 
ggcaactggt 
cccccgtgta 



tcccctgtga 
tgtcgtgcag 
gagtacaccg 
ggagatttgg 
ttgtggtact 
catgagcacg 
gattgaacaa 
ctatgactgg 
gcaggggcgc 
ggacgaggca 
cgacgttgtc 
tctcctgtca 
gcggctgcat 
cgagcgagca 
gcatcagggg 
cgaggatctc 
ccgcttttct 
agcgttggct 
cgtgctttac 
cgagttcttc 
cctctccctc 
cgtttgtcta 
aacctggccc 
tgcaaggtct 
caacgtctgt 
gcggccaaaa 
ttgtgagttg 
ggctgaagga 
catgctttac 
cgtggttttc 
aaaccaaacg 
tcgtcggtgg 
ggaagacttc 
agcccgaggg 
gcttggggtg 
cggacccccg 
tcgccgatct 
ccctggcgca 
ccggttgctc 
ccgcttatga 
caagcattgt 
ttcgggagaa 
acgctagcgt 
ctctctgctc 
tgttcacctt 
ccggccacgt 
cagccctagt 
gggcccattg 
aggttctgat 
ggacgatggc 
aaatccagct 
atgactccct 
ctggatgccc 
ggcccatcac 
caccccggcc 
ccccaagccc 
gggagaatga 
ttggctgtac 
acatcggggg 



ggaactactg 
cctccaggac 
gaattgccag 
gcgtgccccc 
gcctgatagg 
aatcctaaac 
gatggattgc 
gcacaacaga 
ccggttcttt 
gcgcggctat 
actgaagcgg 
tctcaccttg 
acgcttgatc 
cgtactcgga 
ctcgcgccag 
gtcgtgaccc 
ggattcatcg 
acccgtgata 
ggtatcgccg 
tgagtttaaa 
ccccccccct 
tatgttattt 
tgtcttcttg 
gttgaatgtc 
agcgaccctt 
gccacgtgta 
gatagttgtg 
tgcccagaag 
atgtgtttag 
ctttgaaaaa 
taacaccaac 
agtttacctg 
cgagcggtcg 
tagggcctgg 
ggcaggatgg 
gcgtaggtcg 
catggggtac 
tggcgtccgg 
cttttctatc 
agtgcgcaac 
gtatgaggca 
caactcctcc 
ccccactacg 
cgctatgtac 
ctcgcctcgc 
gacaggtcac 
ggtatcgcag 
gggagtccta 
tgtgatgcta 
caaaaacacc 
tgtaaacacc 
caacactggg 
agagcgcatg 
ttacaatgag 
gtgcggtatc 
tgtcgtggtg 
gacggacgtg 
atggatgaat 
gatcggcaat 



60 

120 

180 

240 

300 

360 

420 

480 

540 

600 

660 

720 

780 

640 

900 

960 

1020 

1080 

1140 

1200 

1260 

1320 

1380 

1440 

1500 

1560 

1620 

1680 

1740 

1600 

1860 

1920 

1980 

2040 

2100 

2160 

2220 

2280 

2340 

2400 

2460 

2520 

2580 

2640 

2700 

2760 

2820 

2880 

2940 

3000 

3060 

3120 

3180 

3240 

3300 

3360 

3420 

3480 

3540 
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aaaaccttga cctgccccac ggactgcttc 
tgtggttcgg ggccttggtt gacacccaga 
cactacccct gcactgtcaa ctttaccatc 
gagcacaggc tcgaagccgc atgcaattgg 
agggacagat cagagcttag cccgctgctg 
tgttccttca ccaccctacc ggctctgtcc 
gtggacgtac aatacctgta cggtataggg 
gagtatgtcc tgttgctctt ccttcttctg 
atgatgctgc tgatagctca agctgaggcc 
gcatccgtgg ccggggcgca tggcattctc 
tacatcaagg gcaggctggt ccctggggcg 
ctcctgctcc tgctggcgtt accaccacga 
tcgtgcggag gcgcggtttt cgtaggtctg 
ctgttcctcg ctaggctcat atggtggtta 
ttgcaagtgt ggatcccccc cctcaacgtt 
acgtgcgcga tccacccaga gctaatcttt 
ggtccactca tggtgctcca ggctggtata 
gggctcattc gtgcatgcat gctggtgcgg 
gctctcatga agttggccgc actgacaggt 
cgggactggg cccacgcggg cctacgagac 
tctgatatgg agaccaaggt tatcacctgg 
atcttgggcc tgcccgtctc cgcccgcagg 
agccttgaag ggcaggggtg gcgactcctc 
cgaggcctac ttggctgcat catcactagc 
ggggaggtcc aagtggtctc caccgcaaca 
gtgtgttgga ctgtctatca tggtgccggc 
atcacccaaa tgtacaccaa tgtggaccag 
gcgcgttcct tgacaccatg cacctgcggc 
gccgatgtca ttccggtgcg ccggcggggc 
cccgtctcct acttgaaggg ctcttcgggc 
gtgggcatct ttcgggctgc cgtgtgcacc 
cccgtcgagt ctatggaaac cactatgcgg 
ccggccgtac cgcagacatt ccaggtggcc 
agcactaagg tgccggctgc gtatgcagcc 
tccgtcgccg ccaccctagg tttcggggcg 
aacatcagaa tcggggtaag gaccatcacc 
ggcaagtttc ttgccgacgg tggttgctct 
gagtgccact caactgactc gaccactatc 
gagacggctg gagcgcgact cgtcgtgctc 
gtgccacatc caaacatcga ggaggtggct 
ggcaaagcca tccccatcga gaccatcaag 
aagaagaaat gtgatgagct cgccgcgaag 
tattaccggg gccttgatgt atccgtcata 
acggacgctc taatgacggg ctttaccggt 
tgtgtcaccc agacagtcga cttcagcctg 
gtgccacaag acgcggtgtc acgctcgcag 
ggcatttaca ggtttgtgac tccaggagaa 
ctgtgcgagt gctatgacgc gggctgtgct 
gttaggttgc gggcttacct aaacacacca 
ttctgggaga gcgtctttac aggcctcacc 
aagcaggcag gagacaactt cccctacctg 
gctcaggctc cacctccatc gtgggaccaa 
acgctgcacg ggccaacgcc cctgctgtat 
accacacacc ccataaccaa atacatcatg 
acgagcacct gggtgctggt aggcggagtc 
acaggcagcg tggtcattgt gggcaggatc 
gacagggaag tcctttaccg ggagttcgat 
tacatcgaac agggaatgc? gctcgccgaa 
caaacagcca ccaagcaagc ggaggctgct 
atcgaagcct tctgggcgaa gcatatgtgg 
ggcttgtcca ctctgcctgg caaccccgcg 
atcaccagcc cgctcaccac ccaacatacc 
gccgcccaac ttgctcctcc cagcgctgct 
gcggctgttg gcagcatagg ccttgggaag 
gcaggggtgg caggcgcgct cgtggccttt 
gaggacctgg ttaacctact ccctgctatc 



cggaagcacc ccgaggccac ttacaccaag 3600 
tgcttggtcc actacccata caggctttgg 3660 
ttcaaggtta ggatgtacgt ggggggagtg 3720 
actcgaggag agcgttgtaa cctggaggac 3780 
ctgtctacaa cggagtggca ggtattgccc 3840 
actggtttga tccatctcca tcagaacgtc 3900 
tcggcggttg tctcctttgc aatcaaatgg 3960 
gcggacgcgc gcgtctgtgc ctgcttgtgg 4020 
gccctagaga acctggtggt cctcaacgcg 4080 
tccttcctcg tgttcttctg tgctgcctgg 4140 
gcatatgccc tctacggcgt atggccgcta 4200 
gcatacgcca tggaccggga gatggcagca 4260 
atactcttga ccttgtcacc gcactataag 4320 
caatatttta tcaccagggc cgaggcacac 4380 
cgggggggcc gcgatgccgt catcctcctc 4440 
accatcacca aaatcttgct cgccatactc 4500 
accaaagtgc cgtacttcgt gcgcgcacac 4560 
aaggttgctg ggggtcatta tgtccaaatg 4620 
acgtacgttt atgaccatct caccccactg 4680 
cttgcggtgg cagttgagcc cgtcgtcttc 4740 
ggggcagaca ccgcggcgtg tggggacatc 4800 
gggagggaga tacatctggg accggcagac 4860 
gcgcctatta cggcctactc ccaacagacg 4920 
ctcacaggcc gggacaggaa ccaggtcgag 4980 
caatctttcc tggcgacctg cgtcaatggc 5040 
tcaaagaccc ttgccggccc aaagggccca 5100 
gacctcgtcg gctggcaagc gccccceggg 5160 
agctcggacc tttacttggt cacgaggcat 5220 
gacagcaggg ggagcctact ctcccccagg 5280 
ggtccactgc tctgcccctc ggggcacgct 5340 
cgaggggttg cgaaggcggt ggactttgta 5400 
tccccggtct tcacggacaa ctcgtcccct 5460 
catctacacg cccctactgg tagcggcaag 5520 
caagggtata aggtgcttgt cctgaacccg 5580 
tatatgtcta aggcacatgg tatcgaccct 5640 
acgggtgccc ccatcacgta ctccacctat 5700 
gggggcgcct atgacatcat aatatgtgat 5760 
ctgggcatcg gcacagtcct ggaccaagcg 5820 
gccaccgcta cgcctccggg atcggtcacc 5880 
ctgtccagca ctggagaaat ccccttttat 5940 
ggggggaggc acctcatttt ctgccattcc 6000 
ctgtccggcc tcggactcaa tgctgtagca 6060 
ccaactagcg gagacgtcat tgtcgtagca 6120 
gacttcgact cagtgatcga ctgcaataca 6180 
gacccgacct t caeca ttga gacgacgacc 6240 
eggegaggea ggactggtag gggcaggatg 6300 
cggccctcgg gcatgttcga ttcctcggtt 6360 
tggtacgagc tcacgcccgc cgagacctca 6420 
gggttgcccg tetgecagga ccatctggag 6480 
cacatagacg cccatttctt gtcccagact 6540 
gtagcatacc aggctaeggt gtgegecagg 6600 
atgtggaagt gtctcatacg getaaagect 6660 
aggctgggag ccgttcaaaa cgaggttact 6720 
geatgeatgt cggctgacct ggaggtcgtc 6780 
ctagcagctc tggccgcgta ttgectgaca 6840 
atcttgtccg gaaagcegge catcattccc 6900 
gagatggaag agtgcgcctc acacctccct 6960 
caattcaaac agaaggcaat cgggttgctg 7020 
gctcccgtgg tggaatccaa gtggcggacc 7080 
aatttcatca gegggataca atatttagca 7140 
atagcatcac tgatggcatt cacagcctct 7200 
ctcctgttta acatcctggg gggatgggtg 7260 
tetgettteg taggegcegg catcgctgga 7320 
gtgcttgtgg atattttggc aggttatgga 7380 
aaggtcatga geggegagat gccctccacc 7440 
ctctcccctg gcgccctagt cgtcggggtc 7500 
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gtgtgcgcag cgatactgcg tcggcacgtg ggcccagggg agggggctgt gcagtggatg 7560 

aaccggctga tagcgttcgc ttcgcggggt aaccacgtct cccccacgca ctatgtgcct 7620 

gagagcgacg ctgcagcacg tgtcactcag atcctctcta gtcttaccat cactcagctg 7680 

ctgaagaggc ttcaccagtg gatcaacgag gactgctcca cgccatgctc cggctcgtgg 7740 

ctaagagatg tttgggattg gatatgcacg gtgttgactg atttcaagac ctggctccag 7800 

tccaagctcc tgccgcgatt gccgggagtc cccttcttct catgtcaacg tgggtacaag 7860 

ggagtctggc ggggcgacgg catcatgcaa accacctgcc catgtggggc acagatcacc 7920 

ggacatgtga aaaacggttc catgaggatc gtggggccta ggacctgtag taacacgtgg 7980 

catggaacat tccccattaa cgcgtacacc acgggcccct gcacgccctc cccggcgcca 8040 

aattattcta gggcgctgtg gcgggtggct gctgaggagt acgtggaggt tacgcgggtg 8100 

ggggatttcc actacgtgac gggcatgacc actgacgacg taaagtgccc gtgtcaggtt 8X60 

ccggcccccg aattcttcac agaagtggat ggggtgcggt tgcacaggta cgctccagcg 8220 

tgcaaacccc tcctacggga ggaggtcaca ttcctggtcg ggctcaatca atacctggtt 8280 

gggtcacagc tcccatgcga gcccgaaccg gatgtagcag tgctcacttc catgctcacc 8340 

gacccctccc acattacggc ggagacggct aagcgtaggc tggccagggg atctcctccc 8400 

cccttggcca gctcatcagc tagccagctg tctgcgcctt ccttgaaggc aacatgcact 8460 

acccgtcatg actccccgga cgctgacctc atcgaggcca acctcctgtg gcggcaggag 8520 

atgggcggga acatcacccg cgtggagtca gaaaataagg tagtaatttt ggactctttc 8560 

gagccgctcc aagcggagga ggatgagagg gaagtatccg ttccggcgga gatcctgcgg 8640 

aggtccagga aattccctcg agcgatgccc atatgggcac gcccggatta caaccctcca 8700 

ctgttagagt cctggaagga cccggactac gtccctccag tggtacacgg gtgtccattg 8760 

ccgcctgcca aggcccctcc gataccacct tcacggagga agaggacggt tgtcctgtca 8820 

gaatctaccg tgtcttctgc cttggcggag ctcgccacag agaccttcgg cagctccgaa 8880 

tcgtcggccg tcgacagcgg cacggcaacg gcctctcctg accagccctc cgacgacggc 8940 

gacgcgggat ccgacgttga gtcgtactcc tccatgcccc cccttgaggg ggagccgggg 9000 

gatcccgatc tcagcgacgg gtcttggtct accgtaagcg aggaggctag tgaggacgtc 9060 

gtctgctgct cgatgtccta cacatggaca ggcgccctga tcacgccatg cgctgcggag 9120 

gaaaccaagc tgcccatcaa tgcactgagc aactctttgc tccgtcacca caacttggtc 9180 

tatgctacaa catctcgcag cgcaagcctg cggcagaaga aggtcacctt tgacagactg 9240 

caggtcctgg acgaccacta ccgggacgtg ctcaaggaga tgaaggcgaa ggcgtccaca 9300 

gttaaggcta aacttctatc cgtggaggaa gcctgtaagc tgacgccccc acattcggcc 9360 

agatctaaat ttggctatgg ggcaaaggac gtccggaacc tatccagcaa ggccgttaac 9420 

cacatccgct ccgtgtggaa ggacttgctg gaagacactg agacaccaat tgacaccacc 9480 

atcatggcaa aaaatgaggt tttctgcgtc caaccagaga aggggggccg caagccagct 9540 

cgccttatcg tattcccaga tttgggggtt cgtgtgtgcg agaaaatggc cctttacgat 9600 

gtggtctcca ccctccctca ggccgtgatg ggctcttcat acggattcca atactctcct 9660 

ggacagcggg tcgagttcct ggtgaatgcc tggaaagcga agaaatgccc tatgggcttc 9720 

gcatatgaca cccgctgttt tgactcaacg gtcactgaga atgacatccg tgttgaggag 9780 

tcaatctacc aatgttgtga cttggccccc gaagccagac aggccataag gtcgctcaca 9B40 

gagcggcttt acatcggggg ccccctgact aattctaaag ggcagaactg cggctatcgc 9900 

cggtgccgcg cgagcggtgt actgacgacc agctgcggta ataccctcac atgttacttg 9960 

aaggccgctg cggcctgtcg agctgcgaag ctccaggact gcacgatgct cgtatgcgga 10020 

gacgaccttg tcgttatctg tgaaagcgcg gggacccaag aggacgaggc gagcctacgg 10080 

gccttcacgg aggctatgac tagatactct gccccccctg gggacccgcc caaaccagaa 10140 

tacgacttgg agttgataac atcatgctcc tccaatgtgt cagtcgcgca cgatgcatct 10200 

ggcaaaaggg tgtactatct cacccgtgac cccaccaccc cccttgcgcg ggctgcgtgg 10260 

gagacagcta gacacactcc agtcaattcc tggctaggca acatcatcat gtatgcgccc 10320 

accttgtggg caaggatgat cctgatgact catttcttct ccatccttct agctcaggaa 10380 

caacttgaaa aagccctaga ttgtcagatc tacggggcct gttactccat tgagccactt 10440 

gacctacctc agatcattca acgactccat ggccttagcg cattttcact ccatagttac 10500 

tctccaggtg agatcaatag ggtggcttca tgcctcagga aacttggggt accgcccttg 10560 

cgagtctgga gacatcgggc cagaagtgtc cgcgctaggc tactgtccca gggggggagg 10620 

gctgccactt gtggcaagta cctcttcaac tgggcagtaa ggaccaagct caaactcact 10680 

ccaatcccgg ctgcgtccca gttggattta tccagctggt tcgttgctgg ttacagcggg 10740 

ggagacatat atcacagcct gtctcgtgcc cgaccccgct ggttcatgtg gtgcctactc 10800 

ctactttctg taggggtagg catctatcta ctccccaacc gatgaacggg gagctaaaca 10860 

ctccaggcca ataggccatc ctgttttttt cccttttttt ttttcttttt tttttttttt 10920 

tttttttttt tttttttttc tccttttttt ttcctctttt tttccttttc tttcctttgg 10980 

tggctccatc ttagccctag tcacggctag ctgtgaaagg tccgtgagcc gcttgactgc 11040 
agagagtgct gatactggcc tctctgcaga tcaagt 11076 
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<210> 10 
<211> 8001 
<212> OKA 

<213> Hepatitis C Virus 



10 



15 



20 



25 



30 



35 



40 



45 



50 



<400> 10 

gccagccccc 

tcttcacgca 

cccccctccc 

gacgaccggg 

gcgagactge 

gtgcttgcga 

ctcaaagaaa 

acgcaggttc 

caatcggctg 

ttgtcaagac 

cgtggctggc 

gaagggactg 

ctcctgccga 

cggctacctg 

tggaagccgg 

ccgaactgtt 

atggcgatgc 

actgtggccg 

ttgctgaaga 

ctcccgattc 

cagaccacaa 

aacgttactg 

tccaccatat 

acgagcattc 

gtgaaggaag 

tgcaggcagc 

taagatacac 

gaaagagtca 

gtaccccatt 

tcgaggttaa 

cacgataata 

tgcatcatca 

gtctccaccg 

tatcatggtg 

accaatgtgg 

ccatgcacct 

gtgcgccggc 

aagggctctt 

gctgccgtgt 

ggaaccacta 

acattccagg 

gctgcgtatg 

ctaggtttcg 

gtaaggacca 

gacggtggtt 

gactcgacca 

cgactcgtcg 

atcgaggagg 

atcgagacca 

gagctcgccg 

gatgtatccg 

acgggcttta 

gtcgacttca 

gtgtcacgct 

gtgactccag 

gacgcgggct 

tacctaaaca 

tttacaggcc 

aacttcccct 



gattgggggc 

gaaagcgtct 

gggagagcca 

tcctttcttg 

tagccgagta 

gtgccccggg 

aaccaaacgt 

tccggccgct 

ctctgatgcc 

cgacctgtcc 

cacgacgggc 

gctgctattg 

gaaagtatcc 

cccattcgac 

tcttgtcgat 

cgccaggctc 

ctgcttgccg 

gctgggtgtg 

gcttggcggc 

gcagcgcatc 

cggtttccct 

gccgaagccg 

tgccgtcttt 

ctaggggtct 

cagttcctct 

ggaacccccc 

ctgcaaaggc 

aatggctctc 

gtatgggatc 

aaaacgtcta 

ccatggcgcc 

ctagcctcac 

caacacaatc 

ccggctcaaa 

accaggacct 

gcggcagctc 

ggggcgacag 

cgggcggtcc 

gcacccgagg 

tgcggtcccc 

tggcccatct 

caggccaagg 

gggcgtatat 

tcaccacggg 

gctctggggg 

ctatcctggg 

tgctcgccac 

tggctctgtc 

tcaagggggg 

cgaagctgtc 

tcatacCf-rac 

ccggcgactt 

gcctggaccc 

cgcagcggcg 

gagaacggcc 

gtgcttggta 

caccagggtt 

tcacccacat 

acctggtagc 



gacactccac 

agccatggcg 

tagtggtctg 

gatcaacccg 

gtgttgggtc 

aggtctcgta 

aacaccaacg 

tgggtggaga 

gccgtgttcc 

ggtgccctga 

gttccttgcg 

ggcgaagtgc 

atcatggctg 

caccaagcga 

caggatgatc 

aaggcgcgca 

aatatcatgg 

gcggaccgct 

gaatgggetg 

gccttctatc 

ctagcgggat 

cttggaataa 

tggcaatgtg 

ttcccctctc 

ggaagcttct 

acctggcgac 

ggcacaaccc 

ctcaagcgta 

tgatctgggg 

ggccccccga 

tattacggcc 

aggccgggac 

tttcctggcg 

gacccttgcc 

cgtcggctgg 

ggacctttac 

cagggggagc 

actgctctgc 

ggttgcgaag 

ggtcttcacg 

acacgcccct 

gtataaggtg 

gtctaaggca 

tgcccccatc 

cgcctatgac 

catcggcaca 

cgctacgcct 

cagcactgga 

gaggcacctc 

cggcctcgga 

tagcggagac 

cgactcagtg 

gaccttcacc 

aggcaggact 

ctcgggcatg 

cgagctcacg 

gcccgtctgc 

agacgcccat 

ataccaggct 



catagatcac 

ttagtatgag 

cggaaccggt 

ctcaatgcct 

gcgaaaggcc 

gaccgtgcac 

ggcgcgccat 

ggctattcgg 

ggctgtcagc 

atgaactgca 

cagctgtgct 

cggggcagga 

atgcaatgcg 

aacatcgcat 

tggacgaaga 

tgcccgacgg 

tggaaaatgg 

atcaggacat 

accgcttcct 

gccttcttga 

caattccgcc 

ggccggtgtg 

agggcccgga 

gccaaaggaa 

tgaagacaaa 

aggtgcctct 

cagtgccacg 

ttcaacaagg 

cctcggtgca 

accacgggga 

tactcccaac 

aggaaccagg 

acctgcgtca 

ggcccaaagg 

caagcgcccc 

ttggtcacga 

ctactctccc 

ccctcggggc 

gcggtggact 

gacaactcgt 

actggtagcg 

cttgtcctga 

catggtatcg 

acgtactcca 

atcataatat 

gtcctggacc 

ccgggatcgg 

gaaatcccct 

attttctgcc 

ctcaatgctg 

gtcattgtcg 

atcgactgca 

attgagacga 

ggtaggggca 

ttcgattcct 

cccgccgaga 

caggaccatc 

ttcttgtccc 

acggtgtgcg 



tcccctgtga 
tgtcgtgcag 
gagtacaccg 
ggagatttgg 
ttgtggtact 
catgagcacg 
gattgaacaa 
ctatgactgg 
gcaggggcgc 
ggacgaggca 
cgacgttgtc 
tctcctgtca 
gcggctgcat 
cgagcgagca 
gcatcagggg 
cgaggatctc 
ccgcttttct 
agcgttggct 
cgtgctttac 
cgagttcttc 
cctctccctc 
cgtttgtcta 
aacctggccc 
tgcaaggtct 
caacgtctgt 
gcggccaaaa 
ttgtgagttg 
ggctgaagga 
catgctttac 
cgtggttttc 
agacgcgagg 
tcgaggggga 
atggcgtgtg 
gcccaatcac 
ccggggcgcg 
ggcatgccga 
ccaggcccgt 
acgctgtggg 
ttgtacccgt 
cccctccggc 
gcaagagcac 
acccgtccgt 
accctaacat 
cctatggcaa 
gtgatgagtg 
aagcggagac 
tcaccgtgcc 
tttatggcaa 
attccaagaa 
tagcatatta 
tagcaacgga 
atacatgtgt 
cgaccgtgcc 
ggatgggcat 
cggttctgtg 
cctcagttag 
tggagttctg 
agactaagca 
ccagggctca 



ggaactactg 60 
cctccaggac 120 
gaattgccag 180 
gcgtgccccc 240 
gcctgatagg 300 
aatcctaaac 360 
gatggattgc 420 
gcacaacaga 480 
ccggttcttt 540 
gcgcggctat 600 
actgaagcgg 660 
tctcaccttg 720 
acgcttgatc 780 
cgtactcgga 840 
ctcgcgccag 900 
gtcgtgaccc 960 
ggattcatcg 1020 
acccgtgata 1080 
ggtatcgccg 1140 
tgagtttaaa 1200 
ccccccccct 1260 
tatgttattt 1320 
tgtcttcttg 1380 
gttgaatgtc 1440 
agcgaccctt 1500 
gccacgtgta 1560 
gatagttgtg 1620 
tgcccagaag 1680 
atgtgtttag 1740 
ctttgaaaaa 1800 
cctacttggc 1860 
ggtccaagtg 1920 
ttggactgtc 1980 
ccaaatgtac 2040 
ttccttgaca 2100 
tgtcattccg 2160 
ctcctacttg 2220 
catctttcgg 2280 
cgagtctatg 2340 
cgtaccgcag 2400 
taaggtgccg 2460 
cgccgccacc 2520 
cagaatcggg 2580 
gtttcttgcc 2640 
ccactcaact 2700 
ggctggagcg 2760 
acatccaaac 2820 
agccatcccc 2880 
gaaatgtgat 2940 
ccggggcctt 3000 
cgctctaatg 3060 
cacccagaca 3120 
acaagacgcg 3180 
ttacaggttt 3240 
cgagtgctat 3300 
gttgcgggct 3360 
ggagagcgtc 3420 
ggcaggagac 3480 
ggctccacct 3540 
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ccatcgtggg accaaatgtg gaagtgtctc atacggctaa agcctacgct gcacgggcca 3600 

acgcccctgc tgtataggct gggagccgtt caaaacgagg ttactaccac acaccccata 3660 

accaaataca tcatggcatg catgtcggct gacctggagg tcgtcacgag cacctgggtg 3720 

ctggtaggcg gagtcctagc agctctggcc gcgtattgcc tgacaacagg cagcgtggtc 3780 

5 attgtgggca ggatcatctt gtccggaaag ccggccatca ttcccgacag ggaagtcctt 3840 

taccgggagt tcgatgagat ggaagagtgc gcctcacacc tcccttacat cgaacaggga 3900 

atgcagctcg ccgaacaatt caaacagaag gcaatcgggt tgctgcaaac agccaccaag 3960 

caagcggagg ctgctgctcc cgtggtggaa tccaagtggc ggaccatcga agccttctgg 4020 

gcgaagcata tgtggaattt catcagcggg atacaatatt tagcaggctt gtccactctg 4080 

cctggcaacc ccgcgatagc atcactgatg gcattcacag cctctatcac cagcccgctc 4140 

10 accacccaac ataccctcct gtttaacatc ctggggggat gggtggccgc ccaacttgct 4200 

cctcccagcg ctgcttctgc tttcgtaggc gccggcatcg ctggagcggc tgttggcagc 4260 

ataggccttg ggaaggtgct tgtggatatt ttggcaggtt atggagcagg ggtggcaggc 4320 

gcgctcgtgg cctttaaggt catgagcggc gagttgccct ccaccgagga cctggttaac 4380 

ctactccctg ctatcctctc ccctggcgcc ctagtegtcg gggtcgtgtg cgcagcgata 4440 

ctgcgtcggc acgtgggccc aggggagggg gctgtgcagt ggatgaaccg gctgatagcg 4500 

ttcgcttcgc ggggtaacca cgtctccccc acgcactatg tgcctgagag cgacgctgca 4560 

gcacgagtca ctcagatcct ctctagtctt accatcactc agctgctgaa gaggcttcac 4620 

cagtggatca acgaggactg ctccacgcca tgctccggct cgtggctaag agatgtttgg 4680 

gattggatat gcacggtgtt gactgatttc aagacctggc tccagtccaa gctcctgccg 4740 

cgattgccgg gagtcccctt cttctcatgt caacgtgggt acaagggagt ctggcggggc 4800 

gacggcatca tgcaaaccac ctgcccatgt ggagcacaga tcaccggaca tgtgaaaaac 4860 

ggttccatga ggatcgtggg gcctaggacc tgtagtaaca cgtggcatgg aacattcccc 4920 

20 attaacgcgt acaccacggg cccctgcacg ccctccccgg cgccaaatta ttctagggcg 4980 

ctgtggcggg taggtgctga ggagtacgtg gaggttacgc gggtggggga tttccactac 5040 

gtgacgggca tgaccactga caacgtaaag tgcccgtgtc aggttccggc ccccgaattc 5100 

ttcacagaag tggatggggt gcggttgcac aggtacgctc cagcgtgcaa acccctccta 5160 

cgggaggagg tcacattcct ggtcgggctc aatcaatacc tggttgggtc acagctccca 5220 

tgcgagcctg aaccggatgt agcagtgctc acttccatgc tcaccgaccc ctcccacatt 5280 

acggcggaga cggctaagcg taggctggcc aggggatctc cccccccctt ggccagctca 5340 

25 tcagctagcc agctgtctgc gccttccttg aaggcaacat gcactacccg tcatgactcc 5400 

ccggacgctg acctcatcga ggccaacctc ctgtggcggc aggagatggg cgggaacatc 5460 

acccgcgtgg agtcagaaaa taaggtagta attttggact ctttcgagcc gctccaagcg 5520 

gaggaggatg agaggggagt atccgttccg gcggagatcc tgcggaggtc caggaaattc 5580 

cctcgagcga tgcccatatg ggcacgcccg gattacaacc ctccactgtt agagtcctgg 5640 

aaggacccgg actacgtccc tccagtggta cacgggtgtc cattgccgcc tgccaaggcc 5700 

3 0 ccCccgatac caccttcacg gaggaagagg acggttgtcc tgtcagaatc taccgtgtct 5760 

tctgccttgg cggagctcgc cacagagacc ttcggcagct ccgaatcgtc ggccgtcgac 5820 

agcggcacgg caacggcctc tcctgaccag ccctccgacg acggcgacgc gggatccgac 5880 

gttgagtcgt actcctccat gccccccctt gagggggagc cgggggatcc cgatctcagc 5940 

gacgggtctt ggtctaccgt aagcgaggag gctagtgagg acgtcgtctg ctgctcgatg 6000 

tcctacacat ggacaggcgc cctgatcacg ccatgcgctg cggaggaaac caagctgccc 6060 

atcaatgcac tgagcaactc tttgctccgt caccacaact tggtctatgc tacaacatct 6120 

35 cgcagcgcaa acctgcggca gaagaaggtc acctttgaca gactgcaggt cctggacgac 6180 

cactaccggg acgtgctcaa ggagatgaag gcgaaggcgt ccacagttaa ggctaaactt 6240 

ctatccgtgg aggaagcctg taagctgacg cccccacatt cggccagatc taaatttggc 6300 

tatggggcaa aggacgtccg gaacctatcc agcaaggccg ttaaccacat ccgctccgtg 6360 

tggaaggact tgctggaaga cactgagaca ccaattgaca ccaccatcat ggcaaaaaat 6420 

gaggttttct gcgtccaacc agagaagggg ggccgcaagc cagctcgcct tatcgtattc 6480 

40 ccagatttgg gggttcgtgt gtgcgagaaa atggcccttt acgatgtggt ctccaccctc 6540 

cctcaggccg tgatgggctc ttcatacgga ttccaatact ctcctggaca gcgggtcgag 6600 

ttcctggtga atgcctggaa agcgaagaaa tgccctatgg gcttcgcata tgacacccgc 6660 

tgttttgact caacggtcac tgagaatgac atccgtgttg aggagtcaat ctaccaatgt 6720 

tgtgacttgg cccccgaagc cagacaggcc ataaggtcgc tcacagagcg gctttacatc 6780 

gggggccccc tgactaattc taaagggcag aactgcggct atcgccggtg ccgcgcgagc 6840 

ggtgtactga cgaccagctg cggtaatacc ctcacatgtt acttgaaggc cgctgcggcc 6900 

45 tgtcgagctg cgaagctcca ggactgcacg atgctcgtat gcggagacga ccttgtcgtt 6960 

atctgtgaaa gcgcggggac ccaagaggac gaggcgagcc tacgggcctt cacggaggct 7020 

atgactagat actctgcccc ccctggggac ccgcccaaac cagaatacga cttggagttg 7080 

ataacatcat gctcctccaa tgtgtcagtc gcgcacgatg catctggcaa aagggtgtac 7140 

tatctcaccc gtgaccccac cacccccctt gcgcgggctg cgtgggagac agctagacac 7200 

actccagtca attcctggct aggcaacatc atcatgtaCg cgcccacctt gtgggcaagg 7260 

50 atgatcctga tgactcattt cttctccatc cttctagctc aggaacaact tgaaaaagcc 7320 

ctagattgtc agatctacgg ggcctgttac tccattgagc cacttgacct acctcagatc 7380 

attcaacgac tccatggcct tagcgcattt tcactccata gttactctcc aggtgagatc 7440 

aatagggtgg cttcatgcct caggaaactt ggggtaccgc ccctgcgagt ctggagacat 7500 
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cgggccagaa gtgtccgcgc taggctactg 
aagtacctct tcaactgggc agtaaggacc 
tcccagttgg atttatccag ctggttcgtt 
agcctgtctc gtgcccgacc ccgctggttc 
gtaggcatct atctactccc caaccgatga 
ccatcctgtt tttttccctt tttttttttc 
ttttctcctt tttttttcct ctttttttcc 
cctagtcacg gctagctgtg aaaggtccgt 
tggcctctct gcagatcaag t 



tcccaggggg ggagggctgc cacttgtggc 7560 

aagctcaaac tcactccaat cccggctgcg 7620 

gctggttaca gcgggggaga catatatcac 7680 

atgtggtgcc tactcctact ttctgtaggg 7740 

acggggagct aaacactcca ggccaatagg 7800 

tttttttttt tttttttttt tttttttttt 7860 

ttttctttcc tttggtggct ccatcttagc 7920 

gagccgcttg actgcagaga gtgctgatac 7980 
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<210> 11 
<211> 11076 
<212> DNA 

<213> Hepatitis C Virus 
<400> 11 

gccagccccc gattgggggc gacactccac 
tcttcacgca gaaagcgtct agccatggcg 
cccccctccc gggagagcca tagtggtctg 
gacgaccggg tcctttcttg gatcaacccg 
gcgagactgc tagccgagta gtgttgggtc 
gtgcttgcga gtgccccggg aggtctcgta 
ctcaaagaaa aaccaaacgt aacaccaacg 
acgcaggttc tccggccgct tgggtggaga 
caatcggctg ctctgatgcc gccgtgttcc 
ttgtcaagac cgacctgtcc ggtgccctga 
cgtggctggc cacgacgggc gttccttgcg 
gaagggactg gctgctattg ggcgaagtgc 
ctcctgccga gaaagtatcc atcatggctg 
cggctacctg cccattcgac caccaagcga 
tggaagccgg tcttgtcgat caggatgatc 
ccgaactgtt cgccaggctc aaggcgcgca 
atggcgatgc ctgcttgccg aatatcatgg 
actgtggccg gctgggtgtg gcggaccgct 
ttgctgaaga gcttggcggc gaatgggctg 
ctcccgattc gcagcgcatc gccttctatc 
cagaccacaa cggtttccct ctagcgggat 
aacgttactg gccgaagccg cttggaataa 
tccaccatat tgccgtcttt tggcaatgtg 
acgagcattc ctaggggtct ttcccctctc 
gtgaaggaag cagttcctct ggaagcttct 
tgcaggcagc ggaacccccc acctggcgac 
taagatacac ctgcaaaggc ggcacaaccc 
gaaagagtca aatggctctc ctcaagcgta 
gtaccccatt gtatgggatc tgatctgggg 
tcgaggttaa aaaacgtcta ggccccccga 
cacgataata ccatgggcac gaatcctaaa 
cgccgcccac aggacgtcaa gttcccgggc 
ttgccgcgca ggggccccag gttgggtgtg 
caacctcgtg gaaggcgaca acctatcccc 
gctcagcccg ggtacccctg gcccctctat 
ctcctgtcac cccgtggctc tcggcctagt 
cgcaatttgg gtaaggtcat cgataccctc 
attccgctcg tcggcgcccc cctagggggc 
gttctggagg acggcgtgaa ctatgcaaca 
ttccttttgg ctttgctgtc ctgtttgacc 
gtatccggag tgtaccatgt cacgaacgac 
gcggacatga tcatgcatac ccccgggtgc 
cgctgctggg tagcgctcac tcccacgctc 
acgatacgac gccatgtcga tttgctcgtt 
gtgggagatc tctgcggatc tgttttcctc 
cggcacgaga cagtacagga ctgcaattgc 
cgtatggctt gggatatgat gatgaactgg 
ttactccgga tcccacaagc tgtcgtggat 
gcgggccttg cctactattc catggtgggg 
ctctttgccg gcgttgacgg gggaacctat 
ctcgggatta cgtccctctt ttcacccggg 
aacggcagct ggcacatcaa caggactgcc 
ttccttgctg cgctgttcta cgtgcacaag 
gccagctgca gccccatcga cgcgttcgct 
tcacacagct cggaccagag gccttattgt 
gtacccgcgg cgcaggtgtg tggtccagtg 
gggacgaccg accggttcgg cgtccctacg 
ctgcttctta acaacacgcg gccgccgcaa 
agcactgggt tcaccaagac gtgcgggggc 



catagatcac tcccctgtga ggaactactg 60 
ttagtatgag tgtcgtgcag cctccaggac 120 
cggaaccggt gagtacaccg gaattgccag 180 
ctcaatgcct ggagatttgg gcgtgccccc 240 
gcgaaaggcc ttgtggtact gcctgatagg 300 
gaccgtgcac catgagcacg aatcctaaac 360 
ggcgcgccat gattgaacaa gatggattgc 420 
ggctattcgg ctatgactgg gcacaacaga 480 
ggctgtcagc gcaggggcgc ccggttcttt 540 
atgaactgca ggacgaggca gcgcggctat 600 
cagctgtgct cgacgttgtc actgaagcgg 660 
cggggcagga tctcctgtca tctcaccttg 720 
atgcaatgcg gcggctgcat acgcttgatc 780 
aacatcgcat cgagcgagca cgtactcgga 840 
tggacgaaga gcatcagggg ctcgcgccag 900 
tgcccgacgg cgaggatctc gtcgtgaccc 960 
tggaaaatgg ccgcttttct ggattcatcg 1020 
atcaggacat agcgttggct acccgtgata 1080 
accgcttcct cgtgctttac ggtatcgccg 1140 
gccttcttga cgagttcttc tgagtttaaa 1200 
caattccgcc cctctccctc ccccccccct 1260 
ggccggtgtg cgtttgtcta tatgttattt 1320 
agggcccgga aacctggccc tgtcttcttg 1380 
gccaaaggaa tgcaaggtct gttgaatgtc 1440 
tgaagacaaa caacgtctgt agcgaccctt 1500 
aggtgcctct gcggccaaaa gccacgtgta 1560 
cagtgccacg ttgtgagttg gatagttgtg 1620 
ttcaacaagg ggctgaagga tgcccagaag 1680 
cctcggtgca catgctttac atgtgtttag 1740 
accacgggga cgtggttttc ctttgaaaaa 1800 
cctcaaagaa aaaccaaacg taacaccaac 1660 
ggtggtcaga tcgtcggtgg agtttacctg 1920 
cgcgcgacta ggaagacttc cgagcggtcg 1980 
aaggctcgcc agcccgaggg tagggcctgg 2040 
ggcaatgagg gcttggggtg ggcaggatgg 2100 
tggggcccca cggacccccg gcgtaggtcg 2160 
acgtgcggct tcgccgatct catggggtac 2220 
gctgccaggg ccctggcgca tggcgtccgg 2280 
gggaatctgc ccggttgctc cttttctatc 2340 
atcccagctt ccgcttatga agtgcgcaac 2400 
tgctccaacg caagcattgt gtatgaggca 2460 
gtgccctgcg ttcgggagaa caactcctcc 2520 
gcggccagga acgctagcgt ccccactacg 2580 
ggggcggctg ctctctgctc cgctatgtac 2640 
gtcgcccagc tgttcacctt ctcgcctcgc 2700 
tcaatatatc ccggccacgt gacaggtcac 2760 
tcacctacag cagccctagt ggtatcgcag 2820 
atggtggcgg gggcccattg gggagtccta 2880 
aactgggcta aggttctgat tgtgatgcta 2940 
gtgacagggg ggacgatggc caaaaacacc 3000 
tcatcccaga aaatccagct tgtaaacacc 3060 
ctgaactgca atgactccct caacactggg 3120 
ttcaactcat ctggatgccc agagcgcatg 3160 
caggggtggg ggcccatcac ttacaatgag 3240 
tggcactacg caccccggcc gtgcggtatc 3300 
tactgcttca ccccaagccc tgtcgtggtg 3360 
tacagttggg gggagaatga gacggacgtg 3420 
ggcaactggt ttggctgtac atggatgaat 3480 
cccccgtgta acatcggggg gatcggcaat 3540 
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aaaaccttga cctgccccac ggactgcttc 
tgtggttcgg ggccttggtt gacacccaga 
cactacccct gcactgtcaa ctttaccatc 
gagcacaggc tcgaagccgc atgcaattgg 
agggacagat cagagcttag cccgctgctg 
tgttccttca ccaccctacc ggctctgtcc 
gtggacgtac aatacctgta cggtataggg 
gagtatgtcc tgttgctctt ccttcttctg 
atgatgctgc tgatagctca agctgaggcc 
gcatccgtgg ccggggcgca tggcattctc 
tacatcaagg gcaggctggt ccctggggcg 
ctcctgctcc tgctggcgtt accaccacga 
tcgtgcggag gcgcggtttt cgtaggtctg 
ctgttcctcg ctaggctcat atggtggtta 
ttgcaagtgt ggatcccccc cctcaacgtt 
acgtgcgcga tccacccaga gctaatcttt 
ggtccactca tggtgctcca ggctggtata 
gggctcattc gtgcatgcat gctggtgcgg 
gctctcatga agttggccgc actgacaggt 
cgggactggg cccacgcggg cctacgagac 
tctgatatgg agaccaaggt tatcacctgg 
atcttgggcc tgcccgtctc cgcccgcagg 
agccttgaag ggcaggggtg gcgactcctc 
cgaggcctac ttggctgcat catcactagc 
ggggaggtcc aagtggtctc caccgcaaca 
gtgtgttgga ctgtctatca tggtgccggc 
atcacccaaa tgtacaccaa tgtggaccag 
gcgcgttcct tgacaccatg cacctgcggc 
gccgatgtca ttccggtgcg ccggcggggc 
cccgtctcct acttgaaggg ctcttcgggc 
gtgggcatct ttcgggctgc cgtgtgcacc 
cccgtcgagt ctatgggaac cactatgcgg 
ccggccgtac cgcagacatt ccaggtggcc 
agcactaagg tgccggctgc gtatgcaggc 
tccgtcgccg ccaccctagg tttcggggcg 
aacatcagaa tcggggtaag gaccatcacc 
ggcaagtttc ttgccgacgg t'ggttgctct 
gagtgccact caactgactc gaccactatc 
gagacggctg gagcgcgact cgtcgtgctc 
gtgccacatc caaacatcga ggaggtggct 
ggcaaagcca tccccatcga gaccatcaag 
aagaagaaat gtgatgagct cgccgcgaag 
tattaccggg gccttgatgt atccgtcata 
acggacgctc taatgacggg ctttaccggc 
tgtgtcaccc agacagtcga cttcagcctg 
gtgccacaag acgcggtgtc acgctcgcag 
ggcatttaca ggtttgtgac tccaggagaa 
ctgtgcgagt gctatgacgc gggctgtgct 
gttaggttgc gggcttacct aaacacacca 
ttctgggaga gcgtctttac aggcctcacc 
aagcaggcag gagacaactt cccctacctg 
gctcaggctc cacctccatc gtgggaccaa 
acgctgcacg ggccaacgcc cctgctgtat 
accacacacc ccataaccaa atacatcatg 
acgagcacct gggtgctggt aggcggagtc 
acaggcagcg tggtcattgt gggcaggatc 
gacagggaag tcctttaccg ggagttcgat 
tacatcgaac agggaatg'ta gctcgccgaa 
caaacagcca ccaagcaagc ggaggctgct 
atcgaagcct tctgggcgaa gcatatgtgg 
ggcttgtcca ctctgcctgg caaccccgcg 
atcaccagcc cgctcaccac ccaacatacc 
gccgcccaac ttgctcctcc cagcgctgct 
gcggctgttg gcagcatagg ccttgggaag 
gcaggggtgg caggcgcgct cgtggccttt 
gaggacctgg ttaacctact ccctgctatc 



cggaagcacc ccgaggccac ttacaccaag 3600 
tgcttggtcc actacccata caggctttgg 3660 
ttcaaggtta ggatgtacgt ggggggagtg 3720 
actcgaggag agcgttgtaa cctggaggac 3780 
ctgtctacaa cggagtggca ggtattgccc 3840 
actggtttga tccatctcca tcagaacgtc 3900 
tcggcggttg tctcctttgc aatcaaatgg 3960 
gcggacgcgc gcgtctgtgc ctgcttgtgg 4020 
gccctagaga acctggtggt cctcaacgcg 4080 
tccttcctcg tgttcttctg tgctgcctgg 4140 
gcatatgccc tctacggcgt atggccgcta 4200 
gcatacgcca tggaccggga gatggcagca 4260 
atactcttga ccttgtcacc gcactataag 4320 
caatatttta tcaccagggc cgaggcacac 4380 
cgggggggcc gcgatgccgt catcctcctc 4440 
accatcacca aaatcttgct cgccatactc 4500 
accaaagtgc cgtacttcgt gcgcgcacac 4560 
aaggttgctg ggggtcatta tgtccaaatg 4620 
acgtacgttt atgaccatct caccccactg 4680 
cttgcggtgg cagttgagcc cgtcgtcttc 4740 
ggggcagaca ccgcggcgtg tggggacatc 4800 
gggagggaga tacatctggg accggcagac 4860 
gcgcctatta cggcctactc ccaacagacg 4920 
ctcacaggcc gggacaggaa ccaggtcgag 4980 
caatctttcc tggcgacctg cgtcaatggc 5040 
tcaaagaccc ttgccggccc aaagggccca 5100 
gacctcgtcg gctggcaagc gccccccggg 5160 
agctcggacc tttacttggt cacgaggcat 5220 
gacagcaggg ggagcctact ctcccccagg 5280 
ggtccactgc tctgcccctc ggggcacgct 5340 
cgaggggttg cgaaggcggt ggactttgta 5400 
tccccggtct tcacggacaa ctcgtcccct 5460 
catctacacg cccctactgg tagcggcaag 5520 
caagggtata aggtgcttgt cctgaacccg 5580 
tatatgtcta aggcacatgg tatcgaccct 5640 
acgggtgccc ccatcacgta ctccacctat 5700 
gggggcgcct atgacatcat aatatgtgat 5760 
ctgggcatcg gcacagtcct ggaccaagcg 5820 
gccaccgcta cgcctccggg atcggtcacc 5880 
ctgtccagca ctggagaaat ccccttttat 5940 
ggggggaggc acctcatttt ctgccattcc 6000 
ctgtccggcc tcggactcaa tgctgtagca 6060 
ccaactagcg gagacgtcat tgtcgtagca 6120 
gacttcgact cagtgatcga ctgcaataca 6180 
gacccgacct tcaccattga gacgacgacc 6240 
cggcgaggca ggactggtag gggcaggatg 6300 
cggccctcgg gcatgttcga ttcctcggtt 6360 
tggtacgagc tcacgcccgc cgagacctca 6420 
gggttgcccg tctgccagga ccatctggag 6480 
cacatagacg cccatttctt gtcccagact 6540 
gtagcatacc aggctacggt gtgcgccagg 6600 
atgtggaagt gtctcatacg gctaaagcct 6660 
aggctgggag ccgttcaaaa cgaggttact 6720 
gcatgcatgt cggctgacct ggaggtcgtc 6780 
ctagcagctc tggccgcgta ttgcctgaca 6840 
atcttgtccg gaaagccggc catcattccc 6900 
gagatggaag agtgcgcctc acacctccct 6960 
caattcaaac agaaggcaat cgggttgctg 7020 
gctcccgtgg tggaatccaa gtggcggacc 7080 
aatttcatca gcgggataca atatttagca 7140 
atagcatcac tgatggcatt cacagcctct 7200 
ctcctgttta acatcctggg gggatgggtg 7260 
tctgctttcg taggcgccgg catcgctgga 7320 
gtgcttgtgg atattttggc aggttatgga 7380 
aaggtcatga gcggcgagtt gccctccacc 7440 
ctctcccctg gcgccctagt cgtcggggtc 7500 
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gtgtgcgcag 
aaccggctga 
gagagcgacg 
ctgaagaggc 
ctaagagatg 
tccaagctcc 
ggagtctggc 
ggacatgtga 
catggaacat 
aattattcta 
ggggatttcc 
ccggcccccg 
tgcaaacccc 
gggtcacagc 
gacccctccc 
cccttggcca 
acccgtcatg 
atgggcggga 
gagccgctcc 
aggtccagga 
ctgttagagt 
ccgcctgcca 
gaatctaccg 
tcgtcggccg 
gacgcgggat 
gatcccgatc 
gtctgctgct 
gaaaccaagc 
tatgctacaa 
caggtcctgg 
gttaaggcta 
agatctaaat 
cacatccgct 
atcatggcaa 
cgccttatcg 
gtggtctcca 
ggacagcggg 
gcatatgaca 
tcaatctacc 
gagcggcttt 
cggtgccgcg 
aaggccgctg 
gacgaccttg 
gccttcacgg 
tacgacttgg 
ggcaaaaggg 
gagacagcta 
accttgtggg 
caacttgaaa 
gacctacctc 
tctccaggtg 
cgagtctgga 
gctgccactt 
ccaatcccgg 
ggagacatat 
ctactttctg 
ctccaggcca 
tttttttttt 
tggctccatc 
agagagtgct 



cgatactgcg 

tagcgttcgc 

ctgcagcacg 

ttcaccagtg 

tttgggattg 

tgccgcgatt 

ggggcgacgg 

aaaacggttc 

tccccattaa 

gggcgctgtg 

actacgtgac 

aattcttcac 

tcctacggga 

tcccatgcga 

acattacggc 

gctcatcagc 

actccccgga 

acatcacccg 

aagcggagga 

aattccctcg 
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tcgacagcgg 

ccgacgttga 

tcagcgacgg 
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ccgtgtggaa 

aaaatgaggt 

tattcccaga 

ccctccctca 

tcgagttcct 

cccgctgttt 

aatgttgtga 

acatcggggg 

cgagcggtgt 

cggcctgtcg 

tcgttatctg 

aggctatgac 

agttgataac 

tgtactatct 

gacacactcc 

caaggatgat 

aagccctaga 

agatcattca 

agatcaatag 

gacatcgggc 

gtggcaagta 

ctgcgtccca 

atcacagcct 

taggggtagg 

ataggccatc 

tttttttttc 

ttagccctag 

gatactggcc 



tcggcacgtg 

ttcgcggggt 

agtcactcag 

gatcaacgag 

gatatgcacg 

gccgggagtc 

catcatgcaa 

catgaggatc 

cgcgtacacc 

gcgggtaggt 

gggcatgacc 

agaagtggat 

ggaggtcaca 

gcctgaaccg 

ggagacggct 

tagccagctg 

cgctgacctc 

cgtggagtca 

ggatgagagg 

agcgatgccc 

cccggactac 

gataccacct 

cttggcggag 

cacggcaacg 

gtcgtactcc 

gtcttggtct 

cacatggaca 

tgcactgagc 

cgcaaacctg 

ccgggacgtg 

cgtggaggaa 

ggcaaaggac 

ggacttgctg 

tttctgcgtc 

tttgggggtt 

ggccgtgatg 

ggtgaatgcc 

tgactcaacg 

cttggccccc 

ccccctgact 

actgacgacc 

agctgcgaag 

tgaaagcgcg 

tagatactct 

atcatgctcc 

cacccgtgac 

agtcaattcc 

cctgatgact 

ttgtcagatc 

acgactccat 

ggtggcttca 

cagaagtgtc 

cctcttcaac 

gttggattta 

gtctcgtgcc 

catctatcta 

ctgttttttt 

tccttttttt 

tcacggctag 

tctctgcaga 



ggcccagggg 
aaccacgtct 
atcctctcta 
gactgctcca 
gtgttgactg 
cccttcttct 
accacctgcc 
gtggggccta 
acgggcccct 
gctgaggagt 
actgacaacg 
ggggtgcggt 
ttcctggtcg 
gatgtagcag 
aagcgtaggc 
tctgcgcctt 
atcgaggcca 
gaaaataagg 
ggagtatccg 
atatgggcac 
gtccctccag 
tcacggagga 
ctcgccacag 
gcctctcctg 
tccatgcccc 
accgtaagcg 
ggcgccctga 
aactctttgc 
cggcagaaga 
ctcaaggaga 
gcctgtaagc 
gtccggaacc 
gaagacactg 
caaccagaga 
cgtgtgtgcg 
ggctcttcat 
tggaaagcga 
gtcactgaga 
gaagccagac 
aattctaaag 
agctgcggta 
ctccaggact 
gggacccaag 
gccccccctg 
tccaatgtgt 
cccaccaccc 
tggctaggca 
catttcttct 
tacggggcct 
ggccttagcg 
tgcctcagga 
cgcgctaggc 
tgggcagtaa 
tccagctggt 
cgaccccgct 
ctccccaacc 
cccttttttt 



agggggctgt 
cccccacgca 
gtcttaccat 
cgccatgctc 
atttcaagac 
catgtcaacg 
catgtggagc 
ggacctgtag 
gcacgccctc 
acgtggaggt 
taaagtgccc 
tgcacaggta 
ggctcaatca 
tgctcacttc 
tggccagggg 
ccttgaaggc 
acctcctgtg 
tagtaatttt 
ttccggcgga 
gcccggatta 
tggtacacgg 
agaggacggt 
agaccttcgg 
accagccctc 
cccttgaggg 
aggaggctag 
tcacgccatg 
tccgt caeca 
aggtcacctt 
tgaaggcgaa 
tgacgccccc 
tatccagcaa 
agacaccaat 
aggggggecg 
agaaaatggc 
aeggattcca 
agaaatgece 
atgacatccg 
aggecataag 
ggcagaactg 
ataccctcac 
geacgatget 
aggacgaggc 
gggacccgcc 
cagtcgcgca 
cccttgcgcg 
acatcatcat 
ccatccttct 
gttactccat 
cattttcact 
aacttggggt 
tactgtccca 
ggaccaagct 
tcgttgctgg 
ggttcatgtg 
gatgaaeggg 
ttttcttttt 



gcagtggatg 
ctatgtgcct 
cactcagctg 
cggctcgtgg 
ctggctccag 
tgggtacaag 
acagatcacc 
taacacgtgg 
cccggcgcca 
tacgegggtg 
gtgtcaggtt 
cgctccagcg 
atacctggtt 
catgctcacc 
atctcccccc 
aacatgeact 
geggcaggag 
ggactctttc 
gatcctgegg 
caaccctcca 
gtgtccattg 
tgtcctgtca 
cagctccgaa 
cgacgacggc 
ggagccgggg 
tgaggacgtc 
egctgeggag 
caacttggtc 
tgacagactg 
ggcgtccaca 
acattcggcc 
ggccgttaac 
tga caeca cc 
caagccagct 
cctttacgat 
atactctcct 
tatgggcttc 
tgttgaggag 
gtcgctcaca 
cggctatcgc 
atgttacttg 
cgtatgcgga 
gagectaegg 
caaaccagaa 
egatgeatet 
ggctgcgtgg 
gtatgcgccc 
agctcaggaa 
tgagecaett 
ccatagttac 
accgcccttg 

gggggggagg 

caaactcact 
ttacagcggg 
gtgcctactc 
gagctaaaca 
tttttttttt 



ttcctctttt tttccttttc tttcctttgg 
ctgtgaaagg tccgtgagcc gettgactge 
tcaagt 
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PatentansprOche 

1 . Hepatitis C Virus (HCV) Zellkultursystem, das im wesentiichen eukaryontische Zellen umfa8t die eingeschleustes 
HCV-spezifisches Genmaterial enthalten , dadurch gekennzeichnet, 



3. Zellkultursystem nach Anspruch 1 , dadurch gekennzeichnet, 

15 

daB die Hepatomazellen aus einer Hepatomaprimarzellkultur gewonnen sind. 

4. HCV-RNA-Konstrukt, dadurch gekennzeichnet, 

20 daB es die HCV-spezHischen RNA-Abschnitte 5' NTR, NS3, NS4A. NS4B, NS5A, NS5B und 3' NTR und 

zusatzlich ein selektierbares Markergen (Selektionsgen) umfaBt 

5. HCV- RN A-Konstrukt nach Anspruch 4, dadurch gekennzeichnet, 

25 daB es eine NuWeotidsequenz gemSB einem der Sequenzprototolle SEQ ID NO: 1 bis SEQ ID NO: 1 1 umfaBt. 

6. HCV-RNA-Konstrukt nach Anspruch 4, dadurch gekennzeichnet, 

daB die 3' NTR eine NuWeotidsequenz aufweist, die aus der Gruppe der nachfolgend aufgelisteten NuWeotid- 
30 sequenzen (a) bis (\) ausgewShrt ist: 



5 



daB die eukaryontischen Zellen humane Hepatomazellen sind und daB das eingeschleuste HCV-spezifische 
Genmaterial ein HCV-RNA-Konstrukt ist das die HCV-spezifischen RNA-Abschnitte 5' NTR, NS3, NS4A, 
NS4B, NS5A, NS5B und 3' NTR und zusatzlich ein selektierbares Markergen (Selektionsgen) umfaBt. 



w 2. Zellkultursystem nach Anspruch 1 , dadurch gekennzeichnet, 



daB die Hepatomazellen von einer handelsQbiichen Hepatomazellinie abstammen . 



35 



(a) ACGGGGAGCTAAACACTCCAGGCCAATAGGCCATCCTGTTTTTTTT^ 
TTAGC 1 1 1 1 T 11 i I I T TC TlT i T 1 1 1 1 GAGAGAGAGAGTCTC ACTCTG 
TTGCCCAGACTGGAGT 
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(b) ACGGGGAGCTAAACACTCCAGGCCAATAGGCCATCCTGTTTTTT 
TTTTTAGTCT TTTTTTTTTC TTTTTTTTGA GAGAGAGAGT 
CTCACTCTGT TGCCCAGACT GGAGC 

(c) ACGGGGAGC TAAACACT CC AGGCCAAT AGGCCATCCTGTTTTTT 
TTTAATCTTT TTTTTTTTCT TTTTTTTTGA GAGAGAGAGT 
CTCACTCTGT TGCCCAGACT GCAGC 

(d) ACGGGGAGCTAAACACTCCAGGCCAATAGGCCATCCTGTTTTTT 
TTTTTTAGTC TTTTTTTTTT TCTTTTTTTT TGAGAGAGAG 
AGTCTCACTC TGTTGCCCAG ACTGGAGT 

(e) ACGGG GAGC TAAACACTCC AGGCCAATAGGCCATCCTGTTTTTT 
TTTTTAGTCT TTTTTTTTTT TCTTTTTTTT TGAGAGAGAG 
AGTCTCACTC TGTTGCCCAG ACTGGAGT 

(f) ACGGGGAGCTAAACACTCCAGGCCAATAGGCCATCCTGTTTTTT 
TTTTTAGTCT TTTTTTTTTT TCTTTTTTTT TTGAGAGAGA 
GAGTCTCACT CTGTTGCCCA GACTGGAGT 

(g) ACGGGGAGCTAAACACrCCAGGCCAATAGGCCATCCTGTTTTTT 
TTTTTAGTCT TTTTTTTTTT CTTTTTTTTT GAGAGAGAGA 
GTCTCACTCT GTTGCCCAGA CTGGAGT 

(h) ACGGGGAGCTAAACACTCCAGGCCAATAGGCCATCCTGTTTTTT 
TTTTTTTAAT CTTTTTTTTT TTTTTCCTTT TTTTGAGAGA 
GAGAGTCTCA CTCTGTTGCC CAGACTGGAG T 

(i) ACGGGGAGCTAAACACTCCAGGCCAATAGGCCATCCTGTTTTTT 
TTTTTTAATC TTTTTTTTTT TTTTCTTTTT TTTTTGAGAG 
AGAGAGTCTC ACTCTGTTGC CCAGACTGGA GT 



7. HCV- RN A-Konstrukt nach einem der AnsprOche 4 bis 6, dadurch gekennzeichnet 

daB das selektierbare Markergen ein Resistenzgen und insbesondere eine Antibiotikaresistenzgen ist. 

8. HCV- RNA-Konstrukt nach einem der AnsprOche 4 bis 6, dadurch gekennzeichnet 

daB das selektierbare Markergen ein Neomycinphosphotransferasegen ist 

9. HCV-RNA-Konstrukt nach einem der AnsprOche 4 bis 8. dadurch gekennzeichnet 

daB das selektierbare Markergen strangabwarts der 5' NTR in die HCV-RNA integriert ist. 

10. HCV-RNA-Konstrukt nach einem der AnsprOche 4 bis 9, dadurch gekennzeichnet 
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daB das selektierbare Markergen Ober ein Ribozym bzw. eine Erkennungsstelle fQr ein Ribozym mH der HCV- 
RNAverbunden ist. 

11. HCV-RNA-Konstrukt nach einem der AnsprOche 4 bis 10, dadurch gekennzeichnet 

daB es ein integriertes Reportergen aufweist. 

12. HCV-RNA-Konstrukt nach Anspruch 11, dadurch gekennzeichnet, 

daB das Reportergen ein Gen aus der Gruppe der Luziferasegene, dem CAT-Gen (Chloramphenicol-Acetayl- 
Transferase-Gen), dem lacZ-Gen (beta-Galaktosidasegen), derGFP-Gene (green-fluorescence-protein-Gene 
), dem GUS-Gen (Glukuronidasegen) und dem SEAP-Gen (Sezernierte-Alkalische-Phosphatase-Gen) ist. 

13. HCV-RNA-Konstrukt nach einem der AnsprOche 4 bis 1 1 , dadurch gekennzeichnet 

daB deren Replikation die Expression eines (zellul&ren) Surrogatmarkergens beeinfluBt 

14. HCV-RNA-Konstrukt nach einem der AnsprOche 1 1 bis 13, dadurch gekennzeichnet. 

daB das Resistenzgen derart in das offene Leseraster der HCV-RNA einWoniert ist, daB es erst nach einer pro- 
teolytischen Prozessierung in eine aktive Form OberfOhrbar ist. 

15. HCV-RNA-Konstrukt nach einem der AnsprOche 1 1 bis 14, dadurch gekennzeichnet, 

daB das Reportergen und das selektierbare Markergen derart raumlich in dem Kbnstrukt angeordnet sind, daB 
sie gemeinsam ein Fusionsprotein exprimieren. 

16. Zellkultursystem nach einem der AnsprOche 1 bis 3 dadurch gekennzeichnet, 

daB das HCV-RNA-Konstrukt ein Konstrukt gemaB wenigstens einem d* AnsprOche 4 bis 15 ist 

17. Zellkultursystem nach Anspruch 1 , dadurch gekennzeichnet 

daB die das HCV-RNA-Konstrukt enthaltenden Zellen bei der DSMZ, Braunschweig, BRD, unter der Hinterle- 
gungsnummer DSM ACC2394 (Laborbezeichnung HuBI 9-13) hinterlegt sind. 

18. Verwendung eines Zellkultursystems nach einem der AnsprOche 1 bis 3 oder 16 bis 17 und/oder eines HCV-RNA- 
Konstrukts nach einem der AnsprOche 4 bis 15 zur Herstellung und/oder Evaluierung und/oder Testung von The- 
rapeutika und/oder Diagnostika zur Behandlung von insbesondere HCV-lnfektionen. 

19. Verwendung eines Zellkultureystems nach einem der AnsprOche 1 bis 3 oder 16 bis 17 und/oder eines HCV-RNA- 
Konstrukts nach einem der AnsprOche 4 bis 15 zur Herstellung eines Impfstoffes gegen HCV-lnfektionen. 

20. Verwendung eines HCV-RNA-Kbnstrukts nach einem der AnsprOche 4 bis 15 zur Herstellung einer leberzellspezi- 
f ischen Genfahre fQr die Gentherapie . 

21 . HCV-RNA-Konstrukt nach einem der AnsprOche 4 bis 15, dadurch gekennzeichnet, 

daB es ein integriertes Fremdgen aufweist und dazu geeignet ist dieses Fremdgen in eine Zielzelle einzu- 
schleusen, die zur Expression dieses Fremdgens geeignet ist 

22. Verfahren zur Gewinnung von zellkultur-adaptierten Mutanten eines HCV-RNA-Kbnstrukts gemaB einem der 
AnsprOche 4 bis 15, wobei die Mutanten gegenOber dem HCV-RNA-Konstrukt eine erh6hte Replikationseffizienz 
aufweisen, dadurch gekennzeichnet, 

daB man ein Zellkultursystem gemaB Anspruch 1, bei dem das eingeschleuste HCV-spezifische Genmaterial 
ein HCV-RNA-Konstrukt mit Selektionsgen nach einem der AnsprOche 4 bis 15 ist, auf/in dem dem Selektions- 
gen entsprechenden Selektionsmedium kultiviert, daB man die gewachsenen ZellWone erntet, und daB man 
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aus diesen ZellWonen die HCV-RNA-Konstrukte Oder Teile davon isoGert 

23. Verfahren nach Anspruch 22, dadurch gekennzeichnet 

5 daB man die isoiierten HCV-RNA-Konstrukte wenigstens einmal erneut passagiert, namlich in Zellen eines 

Zeilkuttursystems nach Anspruch 1 einschleust das dabei erhaitene ZeJlkultursystem gemaB Anspaich 1, bei 
dem das eingeschleuste HCV-spezifische Genmaterial das isoiierte HCV-RNA-Konstrukt mit Selektionsgen 
ist aut/in dem dem Selektionsgen entsprechenden Selektionsmedium kultiviert die gewachsenen Zelltione 
errrtet und aus diesen ZellWonen die HCV-RNA-Konstrukte isofiert 

10 

24. Verfahren zur Herstellung von Mutanten eines HCV-Voilangengenoms oder eines HCV-Teilgenoms Oder eines 
beliebigen HCV- Konstrukts rrat im Vergleich zu dem ursprQnglichen HCV-Vbllangengenom oder -Teilgenom oder 
HCV-RNA-Konstrukt erhdhter Replikationseffizienz, dadurch gekennzeichnet 

75 daB man mit einem Verfahren nach Anspruch 22 oder 23 eine zellkuttur-adaptierte Mutante eines HCV-RNA- 

Konstrukts herstellt und isoliert 

daB man die NuWeotid- und Aminosauresequenz dieser Mutante bestimmt und durch Vergleich mit der 
NuHeotkJ- und Aminosauresequenz des ursprQnglichen HCV-RNA-Konstrukts die Art Anzahl und Posrtionen 
der NuWeotid- und Aminosauremutationen bestimmt, 
20 und daB man diese Mutationen entweder durch gezielte Mutagenese oder durch Austausch von Sequenzab- 

schnitten, die die betreffenden Mutationen enthalten, in ein (isoliertes) HCV- Vollangengenom oder ein HCV- 
Teilgenom oder ein beliebiges HCV-RNA-Kbnstrukt einfQhrt. 

25. Zellkuftur-adaptiertes HCV-RNA-Konstrukt mit hoher Replikationseffizienz, dadurch gekennzeichnet 

25 

daB es durch NuWeotid- und/oder Aminosaure -Mutationen von einem HCV-RNA-Kbnstrukt nach einem der 
Anspruche 4 bis 1 5 abieitbar ist und daB es mit einem Verfahren nach einem der AnsprOche 22 bis 24 erhaitiich 
ist. 

30 26. Zellkuftur-adaptiertes HCV-RNA-Konstrukt nach Anspruch 25, dadurch gekennzeichnet 

daB es einen oder mehrere der nachfolgend aufgefQhrten Aminosaureaustausche aufweist, namlich 1283 arg 
-> gly und/oder 1383 glu -> ala und/oder 1577 lys -> arg und/oder 1609 lys -> glu und/oder 1936 pro -> ser 
und/oder 2163 glu -> gly und/oder 2330 lys -> glu und/oder 2442 ile -> val aufweist. 

35 

27. Zellkuftur-adaptiertes HCV-RNA-Konstrukt nach Anspruch 25 oder 26, dadurch gekennzeichnet, 

daB es einen oder mehrere der in Tabelle 3 aufgefQhrten NuWeotid- und/oder Aminosaureaustausche auf- 
weist wobei Tabelle 3 Bestandteil dieses Anspruchs ist 

40 

28. Zellkuttur-adaptierte Mutanten eines HCV-RNA-Konstrukts oder eines HCV-Vollangengenoms mit im Vergleich zu 
dem ursprQnglichen HCV-RNA-Konstrukt oder dem ursprQnglichen HCV- Vollangengenom erhdhter Replikationsef- 
fizienz , dadurch gekennzeichnet, 

45 daB sie mit einem Verfahren erhaitiich ist, bei dem man in einem zellkuftur-adaptierten HCV-RNA-Kbnstrukt 

nach Anspruch 24 durch Sequenzanalyse und Sequenzvergleich die Art und Anzahl der Mutationen bestimmt 
und diese Mutationen in ein HCV-RNA-Konstrukt, insbesondere in ein HCV-RNA-Kbnstrukt gemaB einem der 
Anspruche 4 bis 15, oder in ein (isoliertes) HCV-RNA- Vollangengenom einfQhrt, entweder durch gezielte Muta- 
genese Oder durch Austausch von Sequenzabschnitten, die die betreffenden Mutationen enthalten. 

50 

29. Hepatitis C Viruspartkel oder virus-ahnliche Partikel dadurch gekennzeichnet, 

daB sie mit einem Verfahren nach einem der AnsprOche 22-24 erhaitiich sind. 
55 30. Zellen, infiziert mit Hepatitis C Viruspartikeln oder virus-ahnliche Partikeln gemaB Anspruch 29. 
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(57) The hepatitis C virus (HCV) cell culture system pursuant to the invention consists 
of human hepatoma cells that are transfected with an HCV-RNA construct that comprises 
the HCV-specific RNA sections 5' NTR, NS3, NS4A, NS4B, NS5A, NS5B, and 3' NTR, 
and also at least one selectable marker gene (selection gene). 
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Specification 

[0001] This invention relates to a hepatitis C virus (HCV) cell culture system that 
comprises essentially eucaryotic cells that contain inserted HCV-specific genetic 
material, i.e. that are transfected with HCV-specific genetic material. 

[0002] The hepatitis C virus (HCV) is one of the principal causes of chronic and sporadic 
liver diseases worldwide. Most HCV infections run their course with no recognizable 
clinical symptoms, but 80-90% of those infected are permanent carriers of the virus, and 
50% of these permanent virus carriers have chronic liver inflammation of varying degrees 
of severity. About 20% of those chronically infected develop cirrhosis of the liver in the 
course of 10 to 20 years, on the basis of which primary hepatic cell carcinoma may 
develop. Chronic hepatitis C today is the chief indication for a liver transplant. As yet 
there is no causal therapy. The only therapy available at this time is administration of 
large doses of alpha interferon or a combination of alpha interferon and the purine 
nucleoside analog ribavirin. Of course only about 60% of all those treated respond to this 
therapy, and more than half of all these cases suffer renewed viremia after discontinuing 
treatment. 

Because of its high prevalence, including in the industrialized nations, the severe 
consequences of chronic infections, and the lack of causal therapy, development of an 
HCV-specific chemotherapy is an important goal of pharmaceutical research and 
development. The main problem here so far is the lack of a suitable cell culture system 
that permits study of virus replication and pathogenesis in eucaryotic cells. 

[0003] Because of the small amounts of virus in the blood and tissue, the lack of suitable 
cell culture systems or animal models (the chimpanzee is the only possible experimental 
animal so far), and the lack of efficient systems for producing virus-like particles, it has 
not yet been possible to study or clarify thoroughly the molecular composition of the 
HCV particle. The results available today can be summarized as follows: HCV is an 
enveloped plus-strand RNA virus with a particle diameter of 50-60 nm and an average 
density of 1.03-1.1 g/ml. It was cloned molecularly for the first time in 1989, and 
characterized (Choo et aL, 1989: Science, 244, 359-362). HCV RNA has a length of 
about 9.6 kb (= 9600 nucleotides), positive polarity, and has a single open reading frame 
(ORF) that codes a linear polyprotein of about 3010 amino acids (see Rice 1996, in 
Virology, B. N. Fields, D. M. Knipe, P. M. Howley, Eds. (Lippincott-Raven, 
Philadelphia, PA, 1996), Vol 1, pp. 93 V-960; Glabke 1997,/. Gen. Virol 78, 2397; and 
Bartenschlager 1997, Intervirology - 40, 378, and cf. Fig. 1 A). The polyprotein is cleaved 
into the mature and functionally active proteins during virus replication by cellular and 
viral proteases. 

The proteins within the polyprotein are arranged as follows (from the amino end to the 
carboxyl end): Core-El-E2-p7-NS2-NS3-NS4A-NS4B-NS5A-NS5B. The core protein is 
the main component of the nucleocapsid. The glycoproteins El and E2 are 
transmembrane proteins and main components of the viral envelope. They probably play 
an essential role in the fastening of the virus to the host cell. These three proteins core, 
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El, and E2, make up the viral particle and are therefore called structural proteins. The 
function of the protein p7 is still unclear. The protein NS2 is probably the catalytic 
domain of the NS2-3 protease that is responsible for the processing between the proteins 
NS2 and NS3. The protein NS3 has two functions, namely protease activity in the amino- 
tenninal domain that is essential for polyprotein processing, and an NTPase/helicase 
function in the carboxy-terminal domain that probably plays a role in the replication of 
the viral RNA. The protein NS4A is a cofactor of NS3 protease. The function of the 
protein NS4B is unknown. 

[0004] The open reading frame is flanked at its 5' end by a non-translated region (NTR) 
about 340 nucleotides long that functions as an internal ribosome entry site (IRES), and 
at its 3' end by an NTR about 230 nucleotides long that most probably is important for 
genome replication. Such a 3' NTR is the object of Patent Application PCT/US 96/14033. 
The structural proteins in the amino-terminal quarter of the polyprotein are cleaved by the 
signal peptidase of the host cell. The non-structural proteins (NS) 2 to (NS) 5B are 
processed by two viral enzymes, namely by the NS2-3 and the NS3/4A proteinases. The 
NS3/4A proteinase is needed for all cleavages beyond the carboxy terminus of NS3. The 
role of NS4B is unknown. NS5A, a highly phosphorylated protein, seems to be 
responsible for the interferon resistance of various HCV genotypes (cf Enomoto et al. 
1995, J. Clin. Invest. 96, 224; Enomoto et al. 1996, N. Engl. J. Med. 334, 77; Gale Jr. et 
al. 1997, Virology 230, 217; Kaneko et al. 1994, Biochem. Biophys. Res. Commun. 205, 
320; Reed et al., 1997, J. Virol 71, 7187), and NS5B has been identified as RNA- 
dependent polymerase. 

[0005] Using this information, initial diagnostic systems were developed that depend on 
either the detection of HCV-specific antibodies in the patient's serum or the detection of 
HCV-specific RNA by means of RT-PCR (= Reverse Transcription Polymerase Chain 
Reaction), and that are (have to be) used routinely and or as instructed for all blood stored 
in the meantime. 

[0006] Since the first description of the genome in 1989, numerous partial and complete 
sequences of HCV have been cloned and characterized using the PGR method. 
Comparison of these sequences shows high variability of the viral genome, particularly in 
the region of the NS5B gene, which has ultimately led to classification into 6 genotypes, 
which themselves have also been subclassified again into subtypes a, b, and c. The 
genomic variation is not distributed uniformly over the entire genome. Thus, the S'NTR 
and parts of the 3*NTR are highly preserved, while certain coding sequences sometimes 
vary very shaiply, especially the envelope proteins El and E2. 

[0007] The cloned and characterized partial and complete sequences of the HCV genome 
have also been studied with regard to suitable points of attack for a prospective antiviral 
therapeutic agent. Three viral enzymes have been found here that are available as such 
points of attack. These are (1) the NS3/4A protease complex, (2) the NS3 helicase, and 
(3) the NS5B RNA-dependent RNA polymerase. The NS3/4A protease complex and the 
NS3 helicase have already been crystallized and their three-dimensional structures have 
been clarified (Kim et al. 1996, Cell, 87, 343; Yem et al., 1998, Protein Science, 7, 837; 
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Love et al., 1996, Cell, 87, 31 1; Kim et al., 1998, Structure, 6, 89; Yao et al., 1997, 
Nature Structural Biology, 4, 463; Cho et al, 1998, J. Biol. Chem., 273, 15045); this has 
not yet been accomplished for the NS5B RNA-dependent RNA polymerase. 

Although significant points of attack are defined with these enzymes for the development 
of a therapeutic treatment of chronic HCV infection, and although suitable inhibitors are 
being sought intensively around the world using both 'rational drug design 1 and Tiigh 
throughput screens 1 , therapy development suffers from a large deficit, namely the lack of 
cell culture systems or simple animal models that would permit the reliable detection by 
simple laboratory methods of HCV RNA or HCV antigens. The lack of such cell culture 
systems is also the fundamental reason why the understanding of HCV replication up to 
the present time is still very sketchy, and in broad areas only hypothetical. 

[0008] Although in the opinion of well-informed specialists there exists a close 
evolutionary relationship between HCV and the flaviviruses and pestiviruses, and 
autonomously replicating RNAs are described for these that can be brought directly into 
various cell lines for replication and then show relatively high yields (see Khromykh et 
al., 1997, J. Virol 71, 1497; Behrens et al., 1998, J. Virol 72, 2364; Moser et al., 1998 J. 
Virol 72, 5318), similar attempts with HCV have so far been unsuccessful. 

[0009] Actually it is known from various publications that cell lines or primary cell 
cultures can be infected with high-titer patient's serum containing HCV (Lanford et al. 
1994, Virology 202, 606; Shimizu et al. 1993, Proceedings of the National Academy of 
Sciences, USA, 90, 6037-6041; Mizutani et al. 1996, Journal of Virology, 70, 7219-7223; 
M. Dceda et al. 1998, Virus Res. 56, 157; Fournier et al. 1998, /. Gen. Virol. 79, 2376 and 
citations therein; Ito et al. 1996, Journal of General Virology, 77, 1043-1054), these 
virus-infected cell lines or cell cultures nevertheless do not permit the direct detection of 
HCV RNA or HCV antigens. Neither is the viral RNA in these cells detectable in a 
Northern Blot (a standard procedure for the quantitative determination of RNA) nor are 
the viral proteins detectable in a Western Blot or by immunoprecipitation. It has been at 
all possible only by very tedious and indirect methods to detect HCV replication. These 
unfavorable circumstances show clearly that replication in these known virus-infected 
cell lines or cell cultures is absolutely insufficient. 

[0010] Furthermore it is known from the publications by Yoo et al. (1995, Journal of 
Virology, 69, 32-38) and by Dash et al., (1997, American Journal of Pathology, 151, 363- 
373) that hepatoma cell lines can be transfected with synthetic HCV RNA that was 
obtained by in vitro transcription of cloned HCV genome. In both publications the 
authors assume the fundamental concept that the Vmd.HGV genome is a plus strand RNA 
that functions directly as mRNA after insertion into the cell, to which ribosomes are 
attached and form virus proteins in the course of translation processes, from which 
ultimately new HCV particles (can) form. This viral replication, i.e. these newly formed 
HCV viruses and their RNA, were detected by means of RT PCR. The published results 
of the RT PCR carried out, however, are evidence that the efficiency of HCV replication 
in the described HCV-transfected hepatoma cells is only very slight and in any case is not 
sufficient to measure even qualitatively, not to mention quantitatively, variations in the 
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rate of replication after the selective action of prospective antiviral therapeutic agents. 
Meanwhile it is also disclosed in the state of the art (Y anagj et al., Proc. Natl. Acad. Sci. 
USA, 96, 2291-95, 1999) that highly-preserved 3' NTR is essential for viral replication, 
which is in clear contradiction to the assertions of Yoo et al. and Dash et al., who used 
exclusively HCV genome with shortened 3' NTRs for their experiments, not knowing of 
the authentic 3' end of the HCV genome. 

[0011] The purpose of this invention is to make available an HCV cell culture system in 
which the viral RNA in the transfected cells replicates autonomously and with such high 
efficiency that variations in the rate of replication after the selective action of virus- 
specific and particularly HCV-specific prospective antiviral therapeutic agents can be 
measured qualitatively and quantitatively and using current measurement procedures 
customary in the laboratory. 

[0012] A solution of this problem consists of making available a cell culture system of 
the type mentioned initially in which the eucaryotic cells are human cells, particularly 
hepatoma cells, that are derived preferably from a commercial hepatoma cell line, but 
may also be obtained from a corresponding primary cell culture, and in which the 
inserted HCV-specific genetic material is an HCV-RNA construct that comprises 
essentially the HCV-specific RNA sections 5' NTR, NS3, NS4A, NS4B, NS5A, NS5B, 
and 3' NTR, preferably in the order given, and also comprises at least one selectable 
marker gene (selection gene). "NTR" in this context and below means "non-translated 
region" and is well known to one skilled in the art as a concept and as an abbreviation. 
The phrase "HCV-RNA construct" in this context and below comprises both constructs 
that contain the complete HCV genome and those that contain only a portion thereof, i.e. 
an HCV subgenome. 

A preferred variant of the cell culture system pursuant to the invention that has proved 
itself well in practice is deposited with the DSMZ, German Collection of Microorganisms 
and Cell Cultures GmbH in Braunschweig, Germany, under Number DSM ACC2394 
(laboratory designation HuBl 9-13). 

[0013] The cell culture system pursuant to the invention already makes available for the 
first time an in vitro system in which HCV RNA replicates autonomously and is 
expressed in sufficiently large amounts for quantitative determination of the amounts 
both of HCV RNA and of the HCV-specific proteins to be able to be carried out by 
conventional and reliably accurate biochemical measurement methods. This means that 
for the first time an approximately authentic cell-based HCV replication system is 
available that is urgently needed for the development and testing of antiviral 
pharmaceuticals. This test system now provides the ability to identify potential sites of 
attack for effective HCV-specific therapy and to develop and evaluate HCV-specific 
chemotherapeutic agents. 

[0014] The invention is based on the surprising determination that efficient replication of 
HCV RNA takes place in cells only when transfection is performed with an HCV RNA 
construct that comprises at least the 5' and the 3' non-translated regions (NTR) and the 
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non-structural proteins (NS) 3 to 5B, and additionally has a selectable marker gene 
(selection gene). Apparently the structural genes are not of major importance for the 
occurrence of replication, while on the other hand efficient replication of HCV RNA 
apparently takes place only when the transfected cells are subjected to constant selection 
pressure that is mediated by the selectable marker gene (selection gene) associated with 
the HCV RNA. The marker gene (selection gene) thus appears on the one hand to 
provoke the selection of the cells in which the HCV RNA replicates productively, and on 
the other hand it appears to increase substantially the efficiency of RNA replication. 

[0015] Also an object of the invention is a cell-free HCV RNA construct that is 
distinguished by the fact that it comprises the HCV-specific RNA sections 5' NTR, NS3, 
NS4A, NS4B, NS5A, NS5B, and 3' NTR, preferably in the order given, and also 
comprises a selectable marker gene (selection gene). 

[0016] The expressions 5' NTR and NS3 and NS4A and NS4B and NS5A and NS5B and 
y NTR in this context include any nucleotide sequence that is described in the state of the 
art as a nucleotide sequence for the particular functional section of the HCV genome in 
question. 

[0017] Providing such an HCV RNA construct for the first time makes possible detailed 
analysis of HCV replication, pathogenesis, and evolution in cell cultures. HCV-specific 
viral RNA can be produced selectively in any amount - as the complete genome or as a 
subgenome - and the ability exists to manipulate the RNA construct and with it to 
investigate and to clarify the HCV functions on the gene level. 

[0018] Since all of the HCV enzymes studied so far as principal points of attack for 
therapy, namely NS3/4A protease, NS3 helicase, and NS5B polymerase, are contained in 
the HCV RNA construct pursuant to the invention, it can be used for all corresponding 
studies. 

[0019] An embodiment of the HCV RNA construct that proved itself well in practical use 
is distinguished by the fact that it comprises the nucleotide sequence according to 
sequence protocol SEQ ID NO:l. Other variants of embodiment with comparably 
favorable characteristics for use in practice are characterized by the fact that they 
comprise a nucleotide sequence according to sequence protocol SEQ ID NO:2 or SEQ 
NO:3 or SEQ ID NO:4 or SEQ ID NO:5 or SEQ ID NO:6 or SEQ ID NO:7 or SEQ ID 
NO:8 or SEQ ID NO:9 or SEQ ID NO: 10 or SEQ ID NO: 1 1. 

[0020] There is the ability, to prpyide; the HCV< subgenome construct pursuant to the 
invention with a 3' NTR that has a nucleotide sequenced far unknown for this purpose 
in the state of the art, namely a nucleotide sequence that is selected from the group of 
nucleotide sequences (a) to (i) listed below: 




THIS PAGE BLANK iusto 



EP 1 043 399 A2 



(a) ACGGGGAGCTAAACACTCCAGGCCAATAGGCCATCCTGl 1 IT 11 1T1ITA 
GC TTTTTTT 11 11 ICl ' l IT 1T1T1 GAGAGAGAGAGTCTCACTCTGTTGCCC 
AGACTGGAGT 

(b) ACGGGGAGCTAAACACTCCAGGCCAATAGGCCATCCTGTTTTTT 
TTTTTAGTCT TTTTTTTTTC TTTTTTTTGA GAGAGAGAGT CTCACTCTGT 
TGCCCAGACT GGAGC 

(c) ACGGGGAGCTAAACACTCCAGGCCAATAGGCCATCCTGTTTTTT 
TTTAATCTTT TTTTTTTTCT TTTTTTTTGA GAGAGAGAGT CTCACTCTGT 
TGCCCAGACT GCAGC 

(d) ACGGGGAGCTAAACACTCCAGGCCAATAGGCCATCCTGTTTTTT 
TTTTTTAGTC TTTTTTTTTT TCTTTTTTTT TGAGAGAGAG AGTCTCACTC 
TGTTGCCCAG ACTGGAGT 



(e) ACGGGGAGCTAAACACTCCAGGCCAATAGGCCATCCTGTTTTTT 
TTTTTAGTCT TTTTTTTTTT TCTTTTTTTT TGAGAGAGAG AGTCTCACTC 
TGTTGCCCAG ACTGGAGT 

(f) ACGGGGAGCTAAACACTCCAGGCCAATAGGCCATCCTGTTTTTT 
TTTTTAGTCT TTTTTTTTTT TCnTTTTTTT TTGAGAGAGA GAGTCTCACT 
CTGTTGCCC A GACTGGAGT 

(g) ACGGGGAGCTAAACACTCCAGGCCAATAGGCCATCCTGTTTTTT 
TTTTT AGTCT TTTTTTTTTI CTTTTTTTTT GAGAGAGAGA 
GTCTCACTCT GTTGCCCAGA CTGGAGT 

(h) ACGGGGAGCTAAACACTCCAGGCCAATAGGCCATCCTGTTTTTT 
TTTTTTTAAT CTTTTTTTTT TTTTTCCTTT TTTTGAGAGA 
GAGAGTCTCA CTCTGTTGCC CAGACTGGAG T 



CO 



ACG<3GGAGCTAAACACTCCAGGCCAATAGGCCATCCTGTTTTTT 
TTTTTTAATC TTTTTTTTTI TTTTCTTTTT TTTTTGAGAG 
AGAGAGTCTC ACTCTGTTGC CCAGACTGGA GT 
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The selectable marker gene (selection gene) contained in the HCV RNA constructs 
pursuant to the invention is preferably a resistance gene, especially an antibiotic 
resistance gene. 

This has the benefit that cells transfected with this construct can easily be selected from 
the untransfected cells, for example in the case of an antibiotic resistance gene, by adding 
the particular antibiotic to the cell culture medium, 'Antibiotic' in this context means any 
substance that prevents the non-transfected host cells or the cells in which HCV RNA 
replicates with only low efficiency from living or growing, particularly cell poisons such 
as puromycin, hygromycin, zeocin, bleomycin, or blasticidin. 

[0021] A preferred selectable marker gene (selection gene) or resistance gene that has 
proved itself well in practice is the neomycin phosphotransferase gene. 

[0022] An alternative to antibiotic resistance genes, for example, is the thymidinekinase 
gene, with which an HAT selection can be carried out. 

[0023] The position of the selectable marker gene (selection gene) or of the preferred 
resistance gene or the particularly preferred antibiotic resistance gene in the HCV RNA 
construct is preferably beyond the HCV 5' NTR, i.e. downstream from the 5' NTR and 
upstream from the HCV reading frame. However, insertion in the region of the 3' NTR or 
at another point in the HCV genome or subgenome, for example within the polyprotein, 
is also conceivable. 

[0024] In an alternative embodiment of the HCV RNA construct pursuant to the 
invention, the selectable marker gene (selection gene), particularly an antibiotic 
resistance gene, is connected to the HCV RNA or HCV genome or subgenome sequence 
through a ribozyme or a recognition site for a ribozyme. 

[0025] This provides the advantage that after selection of the cells in which HCV RNA is 
productively replicated, the resistance gene in the cell clones obtained can be removed by 
ribozyme-mediated cleavage of the HCV subgenome sequence, namely by activation of 
the cloned ribozyme, or in case of a construct with a recognition site for a ribozyme, by 
insertion of the ribozyme into the cells (for example by transfection of a ribozyme 
construct or infection with a viral expression vector in which the appropriate ribozyme 
was used). In this way an authentic HCV genome construct is obtained with no resistance 
gene, which is capable of forming authentic infectious virus particles. 

[0026] Another preferred embodiment of the HCV RNA construct pursuant to the 
invention is characterized by the fact that the construct has at least one integrated reporter 
gene. 

[0027] A reporter gene in the following means any gene whose presence can be detected 
readily after transfer into a target organism, and in general by simple biochemical or 
histochemical methods, i.e. that codes for a protein that can be detected and quantified 
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readily and reliably even in small amounts by customary laboratory measurement 
methods. 

[0028] This variant of the HCV RNA construct has the advantage that the extent of 
replication of this construct can be measured easily and quickly by conventional 
laboratory methods by reference to the reporter gene product. 

[0029] The reporter gene is preferably a gene from the group of luciferase genes, the 
CATG gene (chloramphenicol acetyltransferase gene), the lacZ gene (beta-galactosidase 
gene), the GFP gene (green fluorescence protein gene), the GUS gene (glucuronidase 
gene), or the SEAP gene (secreted alkaline phosphatase gene). These reporter genes or 
their products, namely the corresponding reporter proteins, can be determined, for 
example, by fluorescence, chemiluminescence, colorimetrically, or by immunological 
methods (e.g. ELISA). 

[0030] However, a surrogate marker gene is also practical as the reporter gene. Among 
these in this context are genes that code for cellular proteins, nucleic acids, or 
- generally - for functions that are subject to a variation dependent on the virus 
replication, and that consequently are either repressed or activated in cells in which the 
HCV or the HCV RNA construct multiplies. In other words, the reduction or activation of 
this function is a replacement marker for virus replication or replication of the HCV RNA 
construct. 

[0031] The positions of reporter gene and selectable marker gene (selection gene) can be 
chosen so that a fusion protein of the two gene products formed is expressed. In this case 
the advantageous ability exists to arrange these two genes in the HCV RNA construct so 
that their two expressed proteins are first fused through a cutting site for a protease (e.g. 
ubiquitin) or through a self-cleaving peptide (e.g. the 2A protein of picomaviruses), and 
only later are separated again proteolytically. 

However, these two positions can just as well be separated from one another in such a 
way that the two genetic products are expressed separately. (For example in the order: 
Marker or resistance gene - Internal ribosome binding site - Reporter gene). 

In the case of the reporter gene, a variant of embodiment has proved itself particularly 
well in which the reporter gene is cloned into the open reading frame of the HCV genome 
or subgenome specifically in such a~way that itis converted to an active form only after 
proteolytic processing. : f 

[0032] The cell culture system pursuant to the invention in all its variations can be used 
for diverse purposes. These include: 

The discovery of antivirally active substances. These can be, for example: organic 
compounds that intervene directly or indirectly in virus multiplication (for 
example, inhibitors of viral proteases, of NS3 helicase, of NS5B RNA-dependent 
RNA polymerase), antisense oligonucleotides that hybridize at any target 
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sequence within the HCV RNA construct (e.g. the 5' NTR) and lead directly or 
indirectly to an influence on virus multiplication, for example by reduction of 
translation of the HCV polyprotein, or ribozymes that cleave any HCV RNA 
sequence and thus impair virus multiplication. 

The evaluation of any type of antivirally active substances in cell culture. Such 
substances, for example, can be found by 'rational drug design' or Tiigh- 
throughput screening' on the isolated purified enzyme. Evaluation means 
especially determination of the inhibiting properties of the corresponding 
substance and its mechanism of action. 

The identification of new targets of attack, of viral or cellular origin, for HCV- 
specific antiviral therapy. For example, if a cellular protein is essential for viral 
replication, viral replication can likewise be controlled by inhibiting this cellular 
protein. The discovery of such auxiliary factors is likewise possible with the 
system pursuant to the invention. 

Use for resistance determination. It can be assumed that resistance to therapy 
occurs because of the high mutation rate of the HCV genome. Such resistance, 
which is of great importance in the clinical licensing of a substance, can be 
determined with the cell culture system pursuant to the invention. Cell lines in 
which the HCV RNA construct or the HCV genome or subgenome replicates are 
incubated with increasing concentrations of the appropriate substance, and the 
replication of the viral RNA is determined either by means of an introduced 
reporter or by qualitative or quantitative determination of the viral nucleic acids or 
proteins. Resistance exists when no inhibition of replication is observed with 
normal drug concentration. The nucleotide or amino acid replacements 
responsible for resistance to therapy can be determined by recloning of the HCV 
RNA (e.g. by RT-PCR) and sequence analysis. Their causality for resistance to 
therapy can be proven by cloning the corresponding replacements) into the 
original construct. 

The production of authentic viral proteins (antigens) for the development and/or 
evaluation of diagnostic products. The cell culture system pursuant to the 
invention also permits the expression of HCV antigens in cell cultures. These 
antigens in principle can also be used for the design of diagnostic detection 
methods. 

' ' 1 * - >. - f 

The production of HCV viruses and virus-like particles, particularly for the 
development or production of therapeutic agents and vaccines as well as for 
diagnostic purposes. In particular, cell culture-adapted complete HCV genomes 
that can be produced with the cell culture system pursuant to the invention are 
able to replicate in cell cultures with high efficiency. These genomes have all of 
the functions of HCV and are therefore able to produce infectious viruses. 
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[0033] The HCV RNA construct pursuant to the invention can also be used by itself in all 
of its variations for diverse purposes. Among them in particular are: 

The construction of attenuated hepatitis C viruses or HCV-like particles and their 
production in cell cultures; attenuated HCV or HCV-like particles can be 
produced by random mutations, for example point mutations, deletions or 
insertions, i.e., viruses or virus-like particles with full replication competence but 
reduced or absent pathogenicity. Such attenuated HCV or HCV-like particles are 
especially useful as vaccines. 

The construction of HCV RNA constructs with integrated foreign genes, for 
example for use as liver cell-specific gene ferries in gene therapy. Because of the 
pronounced liver cell tropism of HCV and the ability to replace parts of the 
genome with heterologous sequences, HCV RNA constructs can be prepared in 
which the structural proteins are replaced by a therapeutically active gene, for 
example. The HCV RNA construct thus obtained is inserted into cells, preferably 
by transfection, that constitutionally or inducibly express the missing HCV 
functions, for example the structural proteins. By this technique, known to one 
skilled in the art by the term 'transcomplementation', virus particles can be 
produced in which the HCV RNA construct is incorporated. The particles thus 
obtained can be used for the preferential infection of liver cells. The 
therapeutically active foreign gene in them is expressed and then deploys its 
therapeutic action. 

The discovery of permissive cells, i.e. cells in which productive virus 
multiplication occurs. For this purpose either one of the aforementioned HCV 
RNA genome constructs that has the ability to form complete infectious viruses is 
used, or one of the aforementioned HCV subgenome constructs is used that of 
course is first transfected into a cell line according to the aforementioned example 
that expresses the missing functions constitutionally or inducibly. In all these 
cases virus particles are formed that also carry a resistance gene and/or a reporter 
gene, in addition to the HCV sequence. To find cells in which HCV can replicate, 
these cells are infected with the viruses thus prepared and are subjected to 
antibiotic selection, or depending on the HCV RNA construct, they are studied by 
detecting the expression of the reporter gene. Since antibiotic resistance or 
expression of the reporter gene can be detected only when the HCV RNA 
construct replicates, the cells found in this way must be permissive. Almost any 
cell lines or primary cell cultures can be tested and permissivity can be revealed in 
this way. 

[0034] The cell culture system pursuant to the invention also permits the discovery of 
HCV RNA constructs in which there is an increase of replication efficiency because of 
mutations, which occur either randomly in the course of HCV RNA replication or are 
introduced selectively into the construct. Such mutations that lead to a change of 
replication of the HCV RNA construct are known to one skilled in the art as adaptive 
mutations. The invention therefore comprises also methods for obtaining cell culture- 
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adapted mutants of an HCV RNA construct pursuant to the invention according to the 
above description, with the mutants having higher replication efficiency than the original 
HCV RNA construct. It also comprises a method for producing mutants of a full-length 
HCV RNA genome or of a partial HCV RNA genome or an HCV RNA construct with 
increased replication efficiency, as well as cell culture-adapted mutants of HCV RNA 
constructs, full-length HCV genomes, and partial HCV genomes with higher replication 
efficiency than the original constructs, or partial or full-length genomes. 

[0035] The method pursuant to the invention for obtaining cell culture-adapted mutants 
of an HCV RNA construct pursuant to the invention, with the mutants having higher 
replication efficiency than the HCV RNA construct, is characterized by the fact that a cell 
culture system pursuant to Claim 1 in which the inserted HCV-specific genetic material is 
an HCV RNA construct with selection gene pursuant to one of the claims 4 to 19, is 
cultivated in the selection medium corresponding to the selection gene, the grown cell 
line is harvested, and the HCV RNA constructs are isolated from these cell clones. 

[0036] In an advantageous refinement of this production method, the isolated HCV RNA 
constructs are again passed at least once more, namely inserted in cells of a cell culture 
system pursuant to Claim 1, the cell culture system pursuant to Claim 1 that is obtained, 
in which the inserted HCV-specific genetic material is the isolated HCV RNA construct 
with selection gene, is cultivated on/in the selection medium corresponding to the 
selection gene, the grown cell clone is harvested, and the HCV RNA constructs are 
isolated therefrom. 

The degree of adaptive mutations and with it the degree of replication efficiency in the 
HCV RNA constructs in question can be further increased by this variant of the method. 

[0037] The method pursuant to the invention for producing mutants of a full-length HCV 
genome or of a partial HCV genome or of any HCV RNA construct with higher 
replication efficiency than the original full-length HCV genome or partial genome or 
HCV RNA construct is distinguished by the fact that a cell culture-adapted mutant of an 
HCV RNA construct is prepared using one of the two production methods mentioned 
above, it is isolated from the cells, cloned by methods known in the state of the art, and 
sequenced, and the type, number, and positions of the mutations are determined by 
comparison with the nucleotide and amino acid sequences of the original HCV RNA 
construct and these mutations are then introduced into an (isolated) full-length HCV 
genome or partial genome or any HCV RNA constracteither by selective mutagenesis or 
by replacement of sequence sections that the mutations in question contain. 

To detect or verify the mutations that actually bring about a change of replication and in 
particular an increase of replication, a test can be carried out in which the intended 
nucleotide and/or amino acid replacement is introduced into the original HCV RNA 
construct and this in turn is inserted in cell culture. If the inserted mutation actually leads 
to an increase of replication, in the case of an HCV RNA construct with selectable 
marker gene the number of resistant cell clones in the artificially mutated construct 
should be clearly higher than in the untreated construct. In the case of a construct with a 
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reporter gene, the activity and the amount of the reporter should be clearly higher in the 
artificially mutated construct than in the untreated one. 

[0038] The cell culture-adapted HCV RNA constructs pursuant to the invention with 
high replication efficiency are characterized by the fact that they can be derived from an 
HCV RNA construct pursuant to one of the claims 4 to 19 by nucleotide and/or amino 
acid exchanges and that they are available by one of the two methods of production 
mentioned above. 

[0039] These cell culture-adapted HCV RNA constructs can be used to prepare any HCV 
RNA constructs or full-length or partial HCV genomes with increased replication 
efficiency. Either constructs with a selectable resistance gene or constructs with no such 
gene or with a non-selectable reporter gene (e.g. luciferase) can be prepared, since 
because of the very high replication efficiency of the cell culture-adapted HCV RNA 
construct, its replication can be demonstrated even in non-selected cells. 

The cell culture-adapted mutants of an HCV RNA construct or of a full-length HCV 
genome or of a partial HCV genome pursuant to the invention with higher replication 
efficiency than the original HCV RNA construct or than the original full-length HCV 
genome are characterized by the fact that they are available by a method in which the 
type and number of mutations are determined in a cell culture-adapted HC V RNA 
construct by sequence analysis and sequence comparison, and these mutations are 
introduced into an HCV RNA construct, especially into an HCV RNA construct pursuant 
to one of the claims 4 to 19, or into an (isolated) full-length HCV RNA genome, either by 
selective mutagenesis or by replacement of sequence sections that contain the mutations 
in question. 

[0040] A group of especially preferred HCV RNA constructs, full-length HCV genomes, 
and partial HCV genomes with high and very high replication efficiency and 
consequently very good suitability for practical use is characterized by the fact that it has 
one or more or all of the amino acid or nucleotide replacements listed in Table 3 and/or 
one or more of the following amino acid replacements: 1283 arg -> gly, 1383 glu -> ala, 
1577 lys -> arg, 1609 lys -> glu, 1936 pro -> ser, 2163 glu -> gly, 2330 lys -> glu, 2442 
ile -> val. (The numbers refer to the amino acid positions of the polyprotein of the HCV 
isolate conl; see Table 1). 

Special characteristics of the sequences indicated in the sequence protocols: 

SEQ ID NO: 1 

[0041] 

Name: I389/Core-3Vwt 
Structure (nucleotide positions): 



1. 1-341: HCV 5' non-translated region 
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2. 342-1193: HCV core protein-neomycin phosphotransferase fusion protein; 
selectable marker 

3. 1202-1812: Internal ribosome binding site of the encephalomyocarditis virus; 
permits translation of the HCV open reading frame beyond it 

4. 1813-10842: HCV polyprotein from core to non-structural protein 5B 
5. 1813-2385: HCV core protein; structural protein 
6. 2386-2961: Envelope protein 1; structural protein 
7. 2962-4050: Envelope protein 2; structural protein 
8. 4051-4239: Protein p7 

9. 4240-4890: Non-structural protein 2 (NS2); HCV NS2-3 protease 

10. 4891-6783: Non-structural protein 3 (NS3); HCV NS3 
protease/helicase 

11. 6784-6945: Non-structural protein 4A (NS4A); NS3 protease cofactor 

1 2. 6946-7728 : Non-structural protein 4B (NS4B) 

1 3. 7729-9069: Non-structural protein 5 A (NS5 A) 

14. 9070-1 0842: Non-structural protein 5B (NS5B); RNA-dependent RNA 
polymerase 

15. 10846-1 1076: HCV-3' non-translated region 
SEQ ID NO: 2 

[0042] 

Name: I337/NS2-37wt 
Structure (nucleotide positions): 

1. 1-341: HCV 5' non-translated region 

2. 342-1 181: HCV core protein-neomycin phosphotransferase fusion protein; 
selectable marker 

3. 1 190-1800: Internal ribosome binding site of the encephalomyocarditis virus; 
permits translation of the HCV open reading frame beyond it 

4. 1 801-8403: HCV polyprotein from non-structural protein 2 to non- 
structural protein 5B 

5. 1801-2451: Non-structural protein 2 (NS2); HCV NS2-3 protease 
6. 2452-4344: Non-structural protein 3 (NS3);HCV NS3 protease/helicase 
7. 4345-4506: Non-structural protein 4A (NS4A); NS3 protease cofactor 
8. 4507-5289: N.on-stmcturaLprotein 4B|(NS4B) 

9. 5290-6630: Non-structural protein 5A (NS5A) 

10. 6631-8403: Non-structural protein 5B (NS5B); RNA-dependent RNA 
polymerase 

11. 8407-8637: HCV 3' non-translated region 
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SEQ ID NO: 3 

[0043] 

Name: I389/NS3-3'/wt 
Structure (nucleotide positions): 

1. 1-341: HCV 5' non-translated region 

2. 342-1 193: HCV core protein-neomycin phosphotransferase fusion protein; 
selectable marker 

3. 1202-1812: Internal ribosome binding site of the encephalomyocarditis virus; 
permits translation of the HCV open reading frame beyond it 

4. 1813-7767: HCV polyprotein from non-structural protein 3 to non-structural 
protein 5B 

5. 1813-3708: Non-structural protein 3 (NS3); HCV NS3 protease/helicase 

6. 3709-3870: Non-structural protein 4A (NS4A); NS3 protease cofactor 

7. 3871-4653: Non-structural protein 4B (NS4B) 

8. 4654-5994: Non-structural protein 5A (NS5A) 

9. 5995-7767: Non-structural protein 5B (NS5B); RNA-dependent RNA 
polymerase 

1 0. 777 1 -8001 : HCV 3* non-translated region 



SEQ ID NO: 4 



[0044] 

Name: I337/NS3-3Vwt 
Structure (nucleotide positions): 

1. 1-341: HCV 5' non-translated region 

2. 342-1 181: HCV core protein-neomycin phosphotransferase fusion protein; 
selectable marker 

3. 1 190-1 800: Internal ribosome binding site of the encephalomyocarditis virus; 
permits translation of the HCV open reading frame beyond it 
4. 1801-7758: HCV polyprotein from non-structural protein 3 to non-structural 
protein 5B 

5. 1801-3696: Non-structural protein 3/(l£S3); HCV NS3 protease/helicase 

6. 3697-3858: Non-structural protein 4A ; (NS4A); NS3 protease cofactor 

7. 3859-4641: Non-structural protein 4B (NS4B) 

8. 4642-5982: Non-structural protein 5A (NS5A) 

9. 5983-7755: Non-structural protein 5B (NS5B); RNA-dependent RNA 
polymerase 

10. 7759-7989: HCV 3' non-translated region 
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SEQ ID NO: 5 



[0045] 

Name: I389/NS2-37wt 
Structure (nucleotide positions): 

1. 1-341: HCV 5' non-translated region 

2. 342-1193: HCV core protein-neomycin phosphotransferase fusion protein; 
selectable marker 



3. 1202-1 812: Internal ribosome binding site of the encephalomyocarditis virus; 
permits translation of the HCV open reading frame beyond it 
4. 1813-8418: HCV polyprotein from non-structural protein 2 to non-structural 
protein 5B 

5. 1813-2463: Non-structural protein 2 (NS2); HCV NS2-3 protease 

6. 2464-4356: Non-structural protein 3 (NS3); HCV NS3 protease/helicase 

7. 4357-4518: Non-structural protein 4A (NS4A); NS3 protease cofactor 

8. 4519-5301: Non-structural protein 4B (NS4B) 

9. 5302-6642: Non-structural protein 5A (NS5A) 

10. 6643-8415: Non-structural protein 5B (NS5B); RNA-dependent RNA 
polymerase 

1 1 . 8419-8649: HCV 3' non-translated region 



SEQ ID NO: 6 



[0046] 

Name: I389/NS3-379-13F 
Structure (nucleotide positions): 

1. 1-341: HCV 5' non-translated region 

2. 342-1 193: HCV core protein-neomycin phosphotransferase fusion protein; 
selectable marker 

3. 1202-1812: Internal ribosome binding site of the encephalomyocarditis virus; 
permits translation of the HCV open reading frame beyond it 

4. 1813-7767: HCV polyprotein from non-structural protein 3 to non-structural 
protein 5B of the cell culture-adapted mutant 9-13F 

5. 1813-3708: Non-structural protein 3 (NS3); HCV NS3 protease/helicase 

6. 3709-3870: Non-structural protein 4A (NS4A); NS3 protease cofactor 

7. 3871-4653: Non-structural protein 4B (NS4B) 

8. 4654-5994: Non-structural protein 5A (NS5A) 

9. 5995-7767: Non-structural protein 5B (NS5B); RNA-dependent RNA 
polymerase 




THIS PAGE BLANK m 



EP 1 043 399 A2 

7771-8001 : HCV 3' non-translated region 



SEQ ID NO: 7 
[0047] 



Name: I389/core-379-13F 
Structure (nucleotide positions): 

1.1-341: HCV 5' non-translated region 

2. 342-1 193: HCV core protein-neomycin phosphotransferase fusion protein; 
selectable marker 

3. 1202-1812: Internal ribosome binding site of the encephalomyocarditis virus; 
permits translation of me HCV open reading frame beyond it 
4. 1813-10842: HCV polyprotein from core to non-structural protein 5B of the 
cell culture-adapted mutant 9-13F 

5. 1813-2385: HCV core protein; structural protein 

6. 2386-2961: Envelope protein 1; structural protein 

7. 2962-4050: Envelope protein 2; structural protein 
8.4051-4239: Protein p7 

9. 4240-4890: Non-structural protein 2 (NS2); HCV NS2-3 protease 

10. 4891-6783: Non-structural protein 3 (NS3); HCV NS3 
protease/helicase 

11. 6784-6945: Non-structural protein 4A (NS4A); NS3 protease cofactor 

12. 6946-7728: Non-structural protein 4B (NS4B) 

13. 7729-9069: Non-structural protein 5 A (NS5A) 

14. 9070-10842: Non-structural protein 5B (NS5B); RNA-dependent RNA 
polymerase 

15. 10846-11076: HCV 3' non-translated region 



SEQ ID NO: 8 
[0048] 



Name: I389/NS3-3V5.1 
Structure (nucleotide positions): 

1.1-341: HCV 5' non-translated region 

2. 342-1 193: HCV core protein-neomycin phosphotransferase fusion protein; 
selectable marker 

3. 1202-1 812: Internal ribosome binding site of the encephalomyocarditis virus; 
permits translation of the HCV open reading frame beyond it 
4. 1813-7767: HCV polyprotein from non-structural protein 3 to non-structural 
protein 5B of the cell culture-adapted mutant 5.1 
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5. 1813-3708: Non-structural protein 3 (NS3 ); HCV NS3 
protease/helicase 

6. 3709-3870: Non-structural protein 4A (NS4A); NS3 protease cofactor 

7. 3871-4653: Non-structural protein 4B (NS4B) 

8. 4654-5994: Non-structural protein 5B [sic] (NS5A) 

9. 5995-7767: Non-structural protein 5B (NS5B); RNA-dependent RNA 
polymerase 

7771-8001: HCV 3' non-translated region 



SEQ ID NO: 9 
10049] 

Name: I389/core-3 75.1 
Structure (nucleotide positions): 

1. 1-341: HCV 5' non-translated region 

2. 342-1 193: HCV core protein-neomycin phosphotransferase fusion protein; 
selectable marker 

3. 1202-1812: Internal ribosome binding site of the encephalomyocarditis virus; 
permits translation of the HCV open reading frame beyond it 

4. 1813-10842: HCV polyprotein from core to non-structural protein 5B of the 
cell culture-adapted mutant 5.1 



5. 1813-2385: HCV core protein; structural protein 

6. 2386-2961: Envelope protein 1; structural protein 

7. 2962-4050: Envelope protein 2; structural protein 

8. 4051-4239: Protein p7 

9. 4240-4890: Non-structural protein 2 (NS2); HCV NS2-3 protease 

10. 4891-6783: Non-structural protein 3 (NS3); HCV NS3 
protease/helicase 

11. 6784-6945: Non-structural protein 4A (NS4A); NS3 protease cofactor 

12. 6946-7728: Non-structural protein 4B (NS4B) 

13. 7729-9069: Non-structural protein 5A (NS5A) 

14. 9070-10842: Non-structural protein 5B (NS5B); RNA-dependent RNA 
polymerase 

15. 10846-1 1076: HCV 3' non-translated region 



SEQ ID NO: 10 



[0050] 




Name: I389-NS3-3719 
Structure (nucleotide positions): 
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1. 1-341: HCV 5' non-translated region 

2. 342-1193: HCV core protein-neomycin phosphotransferase fusion protein; 
selectable marker 

3. 1202-1812: Internal ribosome binding site of the encephalomyocarditis virus; 
permits translation of the HCV open reading frame beyond it 
4. 1813-7767: HCV polyprotein from non-structural protein 3 to non-structural 
protein 5B of the cell culture-adapted mutant 19 

5. 1813-3708: Non-structural protein 3 (NS3); HCV NS3 
protease/helicase 

6. 3709-3870: Non-structural protein 4A (NS4A); NS3 protease cofactor 

7. 3871-4653: Non-structural protein 4B (NS4B) 

8. 4654-5994: Non-structural protein 5A (NS5A) 

9. 5995-7767: Non-structural protein 5B (NS5B); RNA-dependent RNA 
polymerase 

7771-8001: HCV 3* non-translated region 
SEQIDNOrll 
[0051] 

Name: I389/core-3719 
Structure (nucleotide positions): 

1. 1-341: HCV 5' non-translated region 

2. 342-1193: HCV core protein-neomycin phosphotransferase fusion protein; 
selectable marker 

3. 1202-1812: Internal ribosome binding site of the encephalomyocarditis virus; 
permits translation of the HCV open reading frame beyond it 
4. 1813-10842: HCV polyprotein from core to non-structural protein 5B of the 
cell culture-adapted mutant 19 

5. 1813-2385: HCV core protein; structural protein 

6. 2386-2961: Envelope protein 1; structural protein 

7. 2962-4050: Envelope protein 2; structural protein 

8. 4051-4239: Protein p7 

9. 4240-4890: Non-structural protein 2 (NS2); HCV NS2-3 protease 

10. 4891-6783: Non-structural protein 3 (NS3); HCV NS3 
protease/helicase 

11. 6784-6945: Non-structural protein,4A (NS4A); NS3 protease cofactor 

12. 6946-7728: Non-structural pnkeuv4B (NS4B) 

13. 7729-9069: Non-structural protein 5A (NS5A) 

14. 9070-10842: Non-structural protein 5B (NS5B); RNA-dependent RNA 
polymerase 

15. 10846-1 1076: HCV 3' non-translated region 
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[0052] The invention will be explained in detail below with reference to examples of 
embodiment and associated tables and figures. The figures mentioned show: 

Fig. 1 A: The structure of an HCV-RNA construct pursuant to the invention. At the 
very top is a schematic representation of the structure of the complete parental HCV 
genome with the positions of the genes for the cleavage products core, El, E2, p7, NS2, 
NS3, NS4A, NS4B, NS5A, and NS5B within the polyprotein, and the 5' and 3' non- 
translated regions (5' NTR and 3' NTR) shown as horizontal bars, and with the two 
positions selected for producing the subgenome constructs, namely the position of the 
f GDD catalytic domain 1 of NS5B RNA polymerase (GDD) and the position of the 3' 
boundary of the HCV-IRES (nucleotide positions 1 to 377 or 1 to 389) drawn above the 
genome diagram. The numbers below the genome diagram designate the corresponding 
nucleotide positions. 

Below this are shown schematic representations of the structures of two modified HCV 
RNA constructs (subgenomes) pursuant to the invention, consisting of the 5* HCV-IRES, 
the neomycin phosphotransferase gene (Neo R ), the EMC-IRES (E-l), and the HCV 
sequences from HS2 or NS3 to the authentic 3' end. The position of the 10-amino-acid 
deletion comprising the NS5B polymerase GDD unit is labeled in each case with a 
triangle ( ). 

Fig. 1 B: The result of denaturing formaldehyde-agar gel electrophoresis for 
detecting replicated plus-strand RNA in transfected sub-passed Huh-7 cell clones. 

The positions of the HCV-specific RNAs (arrows) and of the 28S rRNA are indicated to 
the right of Track 12, and the sizes (numbers of nucleotides) of the RNA markers (M) are 
indicated to the left of Track 1 . 

Fig. 1 C: The result of a PCR test followed by Southern Blot to demonstrate the 
absence of integrated replicon DNA in most of the selected cell clones. 
Tracks 1 and 2 show the positive controls, Track 13 shows the negative control. The 
numerical data to the left of Track 1 designate the size of the nucleotide marker molecule. 

Fig. 2 A: The result of a PCR test followed by Southern Blot for the sensitive 
exclusion of integrated replicon DNA (plasmid molecule I 37 7/NS3-37wt) in a cell clone 
(9-13) containing HCV RNA construct. Tracks 7 to 1 1 represent the result of a titration of 
DNA molecules of the construct I 3 7 7 /NS3-37wt without addition of total DNA of the cell 
clone 9-13, and Tracks 2-6 represent the same plasmid molecule with the addition of 1 

g 9-13 DNA in each case prior to PCR (to exclude a PCR inhibitor in the DNA 
preparation). Track 13 represents the negative control (PCR without DNA probe). Track 
1 shows the result obtained with one^. g tOtaLDNX^from the cell clone 9-13. 

Fig. 2 B: The result of a Northern Blot test to quantify HCV plus- and minus-strand 
RNA. The arrows label the positions of replicon RNA. The "plus" and "minus" data 
designate the positive (plus) and negative (minus) polarity of the RNA controls that were 
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applied to the gel. "Minus-strand" and "plus-strand" designate the specificity of the 
radioactive RNA probes. 

Fig- 2 C: Result of formaldehyde-agar gel electrophoresis after radioactive labeling 
of the intracellular^ replicated HCV RNA to detect resistance of the HCV RNA 
replication to dactinomycin. 

Fig. 3 A: Detection of HCV-specific antigens in the selected cell clones by 
immunoprecipitation after metabolic radioactive labeling. Tracks 7-9 represent authentic 
size markers (that Huh-7 cells contained after transient expression of an HCV RNA 
construct); identified HCV PROTEINS ARE LABELED AT THE LEFT EDGE OF 
Track 1, and the molecular weights (in kilodaltons) are indicated at the right edge of 
Track 9. 

Fig. 3 B: Results of an immunofluorescence test to determine the subcellular 
location of HCV antigens. 

Fig. 4: Schematic representation of the structure of a selectable HCV RNA 

construct (complete genome) pursuant to the invention consisting of the 5' HCV-IRES, 
the neomycin phosphotransferase gene (NeoR), a heterologous IRES element, e.g. of the 
encephalomyocarditis virus (E-I), the complete HCV reading frame, and the authentic 3' 
NTR. 

Fig. 5: Schematic representation of the structure of HCV RNA constructs with 

inserted antibiotic resistance gene (A) within the nucleotide sequence that codes for the 
polyprotein (monocistronic RNA), and (B) within the 3' NTR (bicistronic RNA). 



Fig. 6: Schematic representation of the structure of HCV RNA constructs with 

inserted reporter gene (A) as part of an HCV replicon from NS3 to NS5B; the reporter 
protein is ultimately cleaved from the polyprotein by viral or cellular proteases and the 
selectable marker gene (selection gene) or the resistance gene is inserted in the cells by 
cotransfection, (B) as part of a fusion gene of a resistance gene and a reporter gene (for 
example for neomycin phosphotransferase and green fluorescent protein), (C) as part of a 
replicon of a resistance gene and a reporter gene (for example for neomycin 
phosphotransferase and green fluorescent protein), that are connected through a 
nucleotide sequence that codes for an amino acid sequence (hatched region), which can 
be cleaved by a protease or that has self-cleaving (autocatalytic) activity, (D) as an 
independent gene (green fluorescent protein in this case) that is expressed by its own 
internal ribosome-binding site (IRES); the resistance gene (in this case the neomycin 
phosphotransferase gene) is.likewise expressed independently of this by its own internal 
ribosome-binding site (IRES) (polycistronic construct). 

Fig. 7: Schematic representation of the structure of an HCV RNA construct in 

which the resistance gene is joined to the HCV RNA sequence through a ribozyme or a 
recognition site for a ribozyme. The heavy lines represent the HCV 5' and 3 1 NTRs, E-I is 
a heterologous internal ribosome-binding site that is necessary for the expression of the 
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resistance gene, and the gray square represents the ribozyme or a recognition site for a 
ribozyme. 

Fig. 8: Schematic representation of the structure of an HCV RNA construct with 

resistance gene and integrated foreign gene. 

Fig. 9: Procedural method for comparing the specific infectiousness (expressed 

as the number of cell colonies formed) of total RNA versus in vitro transcripts. HCV 
RNA is prepared by in vitro transcription of a corresponding RNA construct and is 
quantified by measuring the optical density at 260 nm (OD 260 nm). A given number of 
these molecules is mixed with a definite amount of total RNA from natural Huh-7 cells 
and this mixture is inserted into natural Huh-7 cells using electroporation. In parallel to 
this, the total RNA of a cell clone that was prepared by the method described in Figure 1 
is isolated by a method known in the state of the art and the amount of HCV RNA that it 
contains is determined by Northern Blot using an HCV-specific RNA probe followed by 
quantification by phospho-imager. A given amount of this total RNA is transfected into 
natural Huh-7 cells similarly to the in vitro transcripts. These cells in the two 
formulations are then subjected to G418 selection and the number of colonies formed is 
determined by counting after fixing and staining with Coomassie Brilliant Blue. To 
determine the transfection efficiency, 1 g of a plasmid that permits the expression of 
luciferase is added to each transfection formulation. An aliquot of the transfected cells is 
harvested after 24 hours and the luciferase activity in the particular cell lysate is 
determined. The number of colonies in each case is normalized to the luciferase 
expression. 

Fig. 10: Sequence analysis of 9-13 clones. Total RNA of the cell clone 9-13 that 
was formed by transfection of the HCV RNA construct I377/NS3-3* was isolated by a 
method known in the state of the art, and the HCV RNA construct was amplified from 
nucleotide position 59 to 9386 by 'long-distance RT-PCR ? using the primer S59 and 
A9413. The PCR fragments were cloned and 1 1 clones (named 9-13 A-K) were 
completely sequenced, with the clones D and I, E and G, and H and J proving to be 
identical. The positions of the amino acid differences in the NS3-5B region between the 
recloned HCV RNA and the parental construct are labeled with a heavy vertical line at 
the particular clone. Each clone was digested with the restriction enzyme Sfi and the 
particular fragment was inserted into the parental construct. Each of these clones was 
transfected in Huh-7 cells and the cells were subjected to selection as described in Figure 
1. The number of cell clones obtained with each construct is noted on the right next to the 
particular construct. 



Fig. 1 1 A: Principle of determination hi replication using a reporter gene. The upper 
part of the figure illustrates the HCV DNA construct l389/Luc/NS3-3', consisting of the 
HCV 5' NTR (nucleotide positions 1-389), the luciferase gene Que), the IRES of the 
encephalomyocarditis virus, HCV NS3-5B, and the 3' NTR. The position of the active 
center of NS5B RNA polymerase into which an inactivated amino acid replacement has 
been inserted is indicated as 'GND'. The plasmids that code for the replication-competent 
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or the defective HCV RNA construct are digested with the restriction enzyme Sea I and 
used for in vitro transcription with T7 RNA polymerase. After removal of the matrix 
DNA, the particular HCV RNA constructs are inserted into natural Huh-7 cells and these 
are harvested at regular intervals. 

Fig. 11 B: Comparison of luciferase activities in cells transfected with the parental 
HCV RNA construct I 38 9/Luc/NS3-37wt (wt) or the following variants: Inactive RNA 
(318 DN), variant 9-13F, or variant 5.1. The cells were harvested 6 (not shown), 24, 48, 
72, 96, 120, 144, and 168 hours after transfection and the luciferase activity was 
determined luminometrically. 

Fig. 12: Selectable full-length HCV genomes (constructs Wcore-375.1 and 
I 38 9/core-379-13F). 

(A) Schematic representation of the full-length construct. The region between the 
two indicated recognition sites for the restriction enzyme Sfi I corresponds to the 
sequences of the highly adapted RNA variants 5.1 . or 9-13F. 

(B) Number of colonies that were obtained after transfection into HUH-7 cells of 
0.1 g RNA transcribed in vitro of the constructs I 38 9/core-375 . 1 shown under A. 
The result of a representative experiment is shown. 

(C) Detection of autonomously replicating full-length HCV RNAs in G418- 
resistant cell clones that were obtained after transfection of the corresponding in 
vitro transcript. The depiction shows the autoradiogram of a Northern Blot that 
was hybridized with a probe against the rceo-resistance gene and the HCV 5 f NTR. 
The controls shown in Tracks 1 and 2 each correspond to 10 8 molecules of the 
indicated in vitro transcripts, mixed with total RNA from natural Huh-7 cells. The 
negative control contains only total RNA from natural Huh-7 cells (Track 3). 
Tracks 4-9 contain 3-10 g total RNA from G418-resistant cell clones that were 
obtained after transfection of in vitro transcribed I 3 8 9 /core-375.1 RNA and 
I 38 9/core-379-13F RNA, respectively. The G418 concentration used for selection 
is indicated in each case. Five of the illustrated cell clones contain the highly 
adapted RNA variant 5.1 (Tracks 4-8), and one contains the adapted RNA variant 
9-13F(Track9). 

Fig. 13: HCV RNA constructs with a reporter gene. (A) Bicistronic HCV RNA 
constructs. The reporter gene is translated using a separate IRES. (B) Monocistronic 
HCV RNA constructs. The reporter gene product is expressed as a fusion protein with an 
HCV protein. The two.portions are joined jthrqugh ; a recognition sequence for a viral or 
cellular protease that permits proteolytic separation of the two fused protein sections. In 
the example shown, the reporter gene product and the particular HCV protein are fused 
through a recognition sequence for ubiquitin (Ub). 

Fig. 14: Tricistronic full-length HCV RNA construct that has a foreign gene 
inserted in addition to the resistance gene. 
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Fig. 15: Monocistronic HCV RNA constructs in which the resistance gene product 
is expressed as a fusion protein with the HCV portion. The resistance gene (RG) is either 
active as a fusion protein or it is fused with a proteolytically cleavable sequence in such a 
way that the resistance gene product is cleaved off from the HCV component by a 
cellular or viral protease. In the example shown, the resistance gene was fused with the 
particular HCV component through the sequence coding for ubiquitin (Ub). 



Example 1 : Preparation of HCV RNA constructs 

(At Synthesis and cloning of a complete HCV con sensus genome bv RT-PCR 

[0053] The HCV genome was isolated from the liver of a chronically infected patient; i.e. 
the HCV was isolated as described below: 

[0054] The complete RNA was isolated from about 100 mg of liver according to the 
method of Chomczynski and Sacci (1987, Anal. Biochem. 162, 156). A reverse 
transcription was performed with 1 ug of this isolated RNA with the primer A6103 
(GCTATCAGCCGGTTCATCCACTGC) or A941 3 (CAGGATGGCCTATTGG 
CCTGGAG) and the 'expand reverse transcriptase' system (Boehringer Mannheim, 
Germany) according to the manufacturer's instructions. A polymerase chain reaction 
(PCR) was performed with the products of this reverse transcription (RT), using the 
'expand long template' system (Boehringer Mannheim, Germany), with the buffer 
containing 2% dimethyl sulfoxide being used. After one hour at 42°C, 1/8 of this reaction 
mixture was used in a first PCR pass with the primers A6103 and S59 
(TGTCTTCACGCAGAAAGCGTCTAG) or A9413 and S4542 (GATGAGCT 
CGCCGCGAAGCTGTCC) being used. After 40 cycles, 1/10 of this reaction mixture 
was used in a second PCR pass with the primers S58 and A49 1 9 
(AGCACAGCCCGCGTCATAGCACTCG) or S4542 and A9386 (TTAGCTCCCCG 
TTCATCGGTTGG). After 30 cycles the PCR products were purified by preparative agar 
gel electrophoresis and the eluted fragments were ligated into the vector pCR2.1 
(Invitrogen) or pBSK II (Stratagene). Four clones of each fragment were analyzed and 
sequenced, and a consensus sequence was determined. For this purpose, the DNA 
sequences were compared with one another. The positions at which the sequence of one 
of the fragments differed from the others, were considered to be unwanted mutation. In 
the case of ambiguities of the sequence, shorter overlapping PCR fragments of the region 
in question were amplified and several clones were sequenced. In this way numerous 
potential mutations in each fragment could be identified and thus an isolate-specific 
consensus sequence could be established. This established consensus sequence or this 
genome belongs to the genotype lb of worldwide distribution. The non-translated region 
at the 3* end (= 3' NTR) was obtainedby, conventional PCR, with an antisense primer 
being used that covers the last 24 nucleotides bfth'e^X-tail' known from the state of the 
art (Tanaka et al., 1995, Biochem. Biophys. Res. Commun. 215, 744; and Rice, PCT/US 
96/14033). The authentic non-translated region at the 5' end (= 5' NTR) downstream from 
the T7 promoter was produced by PCR, with an oligonucleotide being used on the one 
hand that corresponds to a shortened T7 promoter (TAA TAC GAC TCA CTA TAG) and 
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the first 88 nucleotides of HCV, and on the other hand one of the aforementioned 
plasmids that carries one of the 5' fragments of the genome. From the subgenomic 
fragments with the smallest number of non-consensus replacements, a complete HCV 
consensus genome was assembled and inserted into a modified pBR322 vector. 
Differences from the consensus sequence were eliminated by "site-directed mutagenesis". 
To prepare "run-off 1 transcripts with an authentic 3* end, the 3' NTR of the isolate (with 
the end TGT) was modified to AGT (according to the sequence of Genotype 3 = Clone 
'WS 1 according to Kolykhalov et al., 1996, J. Virol 70, 3363) and an additional nucleotide 
replacement was also performed at position 9562 to retain the A:T base pairing in the 
haiipin structure at the 3' end of the 3' NTR (Kolykhalov et al. ibid.). To eliminate an 
internal restriction site for the enzyme Seal, a so-called silent nucleotide replacement was 
also performed. After the combination of the full-length genome with fitting 5' and 3' 
NTRs, the complete HCV sequence was checked. No unwanted nucleotide replacement 
was found. 

[0055] The HCV genome prepared in this way should be hepatotropic by definition. 
(B) Synthesis of selectable HCV sub genome constructs 

[0056] Using the consensus genome described under (A), HCV subgenome constructs 
were prepared that contain the antibiotic resistance gene neomycin-phosphotransferase 
(NPT) and two sequences of internal ribosome binding sites (IRES). The biochemical 
procedural techniques needed to do this are known and familiar to one skilled in the art 
(see Sambrook, J., E. F. Fritsch, T. Maniatis, 1989, Molecular cloning: a laboratory 
manual, 2nd ed., Cold Spring Harbor Laboratory, Cold Spring Harbor, N. Y.; Ausubel et 
al. (eds.); 1994, Current Protocols in Molecular Biology, Vols. 1-3, John Wiley & Sons 
Inc., New York). The antibiotic resistance gene was inserted directly beyond the 5' NTR, 
so that a bicistronic RNA was obtained (see Fig. 1 A). However, the antibiotic resistance 
gene can also just as well be inserted at other sites on the HCV subgenome construct, for 
example in the nucleotide sequence coding for the polyprotein, whereby a monocistronic 
RNA is obtained (see Fig. 5 A) or in the 3' NTR (see Fig. 5 B). The IRES elements are 
one of the two HCV IRES variants nucleotides 1-377 or nucleotides 1-389, on the one 
hand, and on the other the IRES of the encephalomyocarditis virus that controls the 
translation of the HCV sequence downstream from the genes for NS2 or NS3 to the 
authentic 3 ! end of the genome. 

[0057] The two HCV IRES variants mentioned were determined as follows: Based on 
deletion analyses of the 3' boundary of the HCV IRES (Reynolds et al. 1995, EMBO J. 
14, 6010), various sections of the 5' NTR were fused with the NPT gene and analyzed for 
the maximum number of colonies formed with reference tocotransfections with a 
plasmid containing the T7 RNA polymerase gene. The best results were obtained with the 
HCV sequences of 1-377 and 1-389. Since the AUG start codon of the HCV polyprotein 
is located at position 342, and is thus contained in the IRES sequence, there is fusion of 
12 or 16 amino acids of the HCV capsid protein (core protein) with neomycin 
phosphotransferase (see Fig. 1 A). 
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[0058] These modified HCV subgenome constructs accordingly were given the 
designations I 3 77/NS2-3' (or I 3 77/NS3-3') and WNS2-3* (or I 38 9/NS3-3'). They are 
illustrated schematically in Fig. 1A. 

[0059] Various cell lines and primary cell cultures of human hepatocytes were 
transfected with in vitro transcripts of these modified parental HCV subgenome 
constructs I 37 7/NS2-3' (or I 3 7 7 /NS3-3') and I 3 8 9 /NS2-3' (or I 389 /NS3-3'). 

[0060] As parallel negative controls for all transfection experiments, a correspondingly 
modified but defective subgenome was constructed for each modified parental HCV 
subgenome construct, which differs from the parental one in that it has a deletion of 10 
amino acids that comprises the active center of NS5B RNA polymerase (Behrens et al., 
1996 EMBO J. 15, 12; and Lohmann et ah, 1997,7. Virol 71,8416). 

(C) Synthesis of selectable HCV genome constructs 

[0061] An NS2-3' subgenome construct that is joined at the 5' end to a fragment of the 
luciferase gene and the complete EMCV IRES was restricted with Ncol and Spel, and 
purified by preparative agar gel electrophoresis. The vector thus obtained was ligated in a 
3-factor ligation with an Ncol/Notl HCV fragment corresponding to nucleotide positions 
342 to 1968 of the HCV genome, and with an Notl/Spel fragment corresponding to 
nucleotide positions 1968-9605. The construct obtained, in which the complete HCV 
reading frame and the 3' NTR are downstream from the luciferase fragment and the 
EMCV IRES, was then restricted with Pmel and Spel and ligated with the analogously 
restricted I 38 9/NS3-3Vwt subgenome construct vector. This selectable HCV genome 
construct is illustrated in Fig. 4. 

CD) Preparation of in vitro transcripts corresponding to the HCV RNA constructs 

[0062] The purified plasmid DNAs described above were linearized with Seal and after 
phenol/chloroform extraction and isopropanol precipitation they were used in an in vitro 
transcription reaction using the following components: 80 mM HEPES, pH 7.5, 12.5 mM 
MgCl 2 , 2 mM Spermidin, 40 mM dithiothreitol, 2 mM of each NTP, 1 unit of RNasin/^1, 
50 ng/ml restricted DNA, and about 2 units/^il of T7 RNA polymerase. After 2 hours at 
37°C, half of the amount of T7 polymerase was added and the reaction formulation was 
incubated 2 hours longer. To remove DNA, the mixture was extracted with acidic phenol 
(U. Kedzierski, J. C. Porte, 1991, Bio Techniques 10, 210), precipitated with isopropanol, 
the pellet was dissolved in water, and was incubated with DNase (2 units per jag DNA) 
for 60 min. at 37°C. After the subsequent extraction with acidic phenol, acidic 
phenol/chloroform, and chloroform^and precipitation with isopropanol, the dissolved 
RNA was quantified by optical density measurement* and ,the absence of damage to it was 
checked by formaldehyde-agar gel electrophoresis. 

Example 2: Transfection experiments with the hepatoma cell line Huh-7 
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[0063J Care was taken in all transfection experiments to see that any matrix DNA had 
previously been removed, to avoid such DNA being integrated into transfected cells and 
being able to impart neomycin resistance to them independently of HCV replication. For 
this reason, after the in vitro transcription (Example 1 D), the reaction mixture was 
treated with 2 units of DNase per ng of DNA for 60 min. at 37°C and extracted with 
acidic phenol, acidic phenol/chloroform, and chloroform. Before use for transfection, the 
precipitated RNA was analyzed by formaldehyde-agar gel electrophoresis. 

[0064] Three separate transfection experiments were carried out with the highly 
differentiated human hepatoma cell line Huh-7 (by the method of Nakabayashi et al. 
1982, Cancer Res. 42, 3858). In each case, 15 ^g of RNA was inserted into 8 x 10 6 Huh- 
7 cells using electroporation, and these cells where then plated in culture dishes 10 cm in 
diameter. 24 hours later neomycin (= G41 8) was added at a final concentration of 1 
mg/ml. The culture medium was changed twice each week. After 3-5 weeks, small 
colonies were recognizable and were isolated and subjected to another pass under the 
same culture conditions. 

[0065] The cell clones that were obtained in the course of the first experiment were 
isolated and submitted to subpassage. During this procedure, most of the clones died, and 
the final yield was only 9 clones of cells that had been transfected with a defective HCV 
genome construct, namely a defective NS2-3' HCV RNA. Other than a shortened 
doubling time and the occasional appearance of irregularly formed cells, no constant 
morphological differences were found between these 9 cell clones and the one cell clone 
(clone 8-1) or the parental Huh-7 cells. 

[0066] The main criteria for the functioning HCV genome constructs are the formation of 
viral RNA of correct size and the absence of (integrated) plasmid DNA, which could 
transfer or impart G41 8 resistance. 

[0067] To determine the HCV RNA in the Huh-7 cells, the total RNA was isolated and 
analyzed by the current Northern Blot method using a plus strand-specific riboprobe (= 
RNA probe). To do this, total RNA from the particular cell clones were isolated by the 
method of Chomczynski and Sacchi 1987, Anal Biochem. 162, 156, and 10 \ig of RNA, 
which corresponds to the total RNA content of 0.5-1 x 10 6 cells, was separated out by 
denaturing formaldehyde-agar gel electrophoresis (Tracks 3 to 12 of Fig. 1 B). At the 
same time, as size markers with authentic sequence, 10 9 in vitro transcripts (ivtr.) that 
correspond to the I 38 9/NS2-37wt or I 38 9/NS3-37wt replicon RNAs were separated along 
with it (Track 1 and Track 2, respectively). The separated RNA was transferred to Nylon 
membranes and hybridized with radioactively labeled plus strand-specific RNA probe 
that was complementary to the complete NPT gene and the HCV IRES from nucleotide 
377 to nucleotide 1. The positions of the HCV-specific pJAs (arrows) and of the 28S 
rRNA are indicated to the right of Track 12, and the sizes (numbers of nucleotides) of the 
RNA markers are indicated to the left of Track 1 . The RNA marker fragments contain 
HCV sequences and therefore hybridize with the riboprobe (= RNA probe). The results of 
this analysis are shown in Fig. 1 B. 
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[0068] With the exception of Clone 8-1 transfected with the defective clone 8-1, all of 
the cell clones provided homogeneous HCV RNAs of correct length (about 8640 
nucleotides in the case of NS2-3' and about 7970 nucleotides in the case of the NS3-3' 
replicon). This finding indicates that the functional replicons and the functional HCV 
genome constructs transmit G418 resistance. To exclude the possibility that the G418 
resistance can be attributed to a plasmid DNA that is integrated into the genome of the 
Huh-7 host cell and is transcribed under the control of a cellular promoter, the DNA from 
each clone was examined by NPT-gene-specific PCR. The DNA from the selected Huh-7 
cell lines was isolated by digestion with proteinase K (40 jig/ml, 1 h, 37°C) in 10 mM 
Tris, pH 7.5, 1 mM EDTA, 0.5% SDS, and then extraction with phenol, 
phenol/chloroform, and precipitation with isopropanol. The DNA precipitate was 
dissolved in 10 mM Tris (pH 7.5) and 1 mM EDTA and incubated for 1 hour with Rnase 
A. After phenol/chloroform extraction and ethanol precipitation, 1 \ig DNA, 
corresponding to 4-8 x 10 4 cells, was analyzed by PCR using NPT-gene-specific primer 
(5 t -TCAAGACCGACCTGTCCGGTGCCC-3 , and 

5 , -CTTGAGCCTGGCGAACAGTTCGGC-3 , ) J and a DNA fragment consisting of 379 
nucleotides was produced. The specificity of the PCR product was tested by the Southern 
Blot method, with a digoxigenin-labeled DNA fragment being used that corresponds to 
the NPT gene. As positive controls (to detect any contaminating nucleic acids present), 
the PCR procedure was carried out with 10 7 plasmid molecules or 1 jig DNA from a 
BHK cell line that was stably transfected with a neomycin resistance gene, and as 
negative control the PCR was carried out with the same reagents but with no added DNA. 

The results of this study are shown in Fig. 1 C. Tracks 1 and 2 represent the positive 
controls, and Track 13 represents the negative control. The numerical data to the left of 
Track 1 designate the size of the nucleotide marker molecule. Other than in clone 7-3 
(Figure 1 C, Track 3), which originates from cells after transfection with an NS2-3 1 
replicon/NS2-3' HCV genome construct, and in clone 8-1 (Fig. 1C, Track 12), which 
originates from cells after transfection with a defective HCV genome, NPT DNA was not 
detectable in any of the cell clones. This finding is further indication that the G418 
resistance of most of the clones was imparted by the replicating HCV RNA. However, 
independently of these results, it is also improbable that HCV RNAs with the correct size 
are produced from integrated plasmid DNA, since the plasmids used for the in vitro 
transcription contained neither a eucaryotic promoter nor a polyadenylation signal. In the 
case of the clone 7-3, the resistance was therefore with the greatest probability imparted 
both by the HCV RNA construct and the replicating HCV RNA, and also by an 
integrated NTP DNA sequence, while the resistance of the cells of clone 8-1 can be 
attributed exclusively to the integrated plasmid DNA. 

[0069] To verify that the G41 8 resistance is imparted by:an autonomously replicating 
HCV RNA, clone 9-13 (Fig. 1 B, Track 1 1) was subjected to further tests. Clone 8-1, 
which carries integrated copies of the NPT gene, was used everywhere as the negative 
control. With the objective of rigorously excluding the presence of NPT DNA in clone 9- 
13, a PCR was performed that permits the detection of < 1000 NPT gene copies in 
-40,000 cells. The result of this PCR is shown in Fig. 2 A. In detail, the procedure for this 
PCR was as follows: 
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In each case lOMo 2 plasmid molecules (I 37 7/NS3-37wt) were used either directly (Tracks 

7- 1 1) in the test or after adding 1 ug of 9-13 DNA (Tracks 2-6). The specificity of the 
amplified DNA fiagment was determined by Southern Blot using an NPT-specific probe. 
A PCR with no DNA probe was performed as a negative control (Track 12). 

Even with this sensitive method, no plasmid DNA was found in one ug of DNA of cell 
clone 9-13 (Track 1). To estimate the amount of HCV plus- and minus-strand RNAs in 
these cells, a dilution series of total RNA was analyzed by the Northern Blot method 
using a plus- or minus-strand-specific radioactively labeled riboprobe (= RNA probe). To 
do this, 8, 4, or 2 ug of total RNA that had been isolated from the cell clones 9-13 and 

8- 1 was analyzed in parallel with known amounts of analogous in vitro transcripts with 
plus- or minus-strand polarity (control RNAs) by the Northern Blot method, and then 
subjected to hybridization. The hybridization was carried out with a plus-strand-specific 
riboprobe that covered the complete NPT gene and the HCV IRES ("plus strand', top 
image table) or with a minus-strand-specific RNA probe that was complementary to the 
NS3 sequence ('minus strand', bottom image table). The arrows mark the positions of 
replicon RNA. The results of this analysis are shown in Fig. 2 B. 

In the case of the plus strand, about 10 8 copies of total RNA were detected, which 
corresponds to 1000-5000 HCV RNA molecules per cell, while the amount of minus 
strand RNA was lower by a factor of 5 to 10. This result is in agreement with the 
assumption that the minus strand RNA is the replicative intermediate form or 
intermediate copy that serves as a template for the synthesis of the plus strand molecule. 

Since the reaction is catalyzed essentially by the viral RNA-dependent RNA polymerase, 
the synthesis of HCV RNAs should be resistant to dactinomycin, an antibiotic that 
selectively inhibits RNA synthesis from DNA matrices but not RNA synthesis from RNA 
matrices. To confirm this supposition, cells were incubated with [ 3 H]uridine in the 
presence of dactinomycin, the radioactively labeled RNAs were extracted, separated by 
means of denaturing agar gel electrophoresis, and analyzed with a commercial bio-imager 
using an [ 3 H] -sensitive image plate. To do this, in each case about 5 x 10 5 cells of clones 

9- 13 and 8-1 were incubated with 100 uCi of [ 3 H]uridine for 16 hours in the absence (-) 
or presence (+) of 4 ug/ml dactinomycin (Dact). After this labeling reaction, the total 
RNA was prepared and analyzed by formaldehyde-agar electrophoresis. In the two first 
tracks, only 1/10 of the total RNA is shown. The radioactively labeled RNA was made 
visible with a BAS-2500 Bio-imager (Fuji Company). 

The results of this analysis are shown in Fig. 2 C. In conformity with the inhibitor profile 
of NS5B polymerase (Behrens et al., 1996, EMBO J. 15, 12, AND Lohmann et al., 1997, 
J. Virol. 71, 8416), the replication of the HCV RNA had not been affected by 
dactinomycin, while the synthesis of cellular RNA had been inhibited. To verify the 
identity of the viral RNA, an RT PCR was performed to redone the replicated sequences. 
Sequence analysis of the recloned RNA showed that the RNA in clone 9-13 is HCV- 
specific and conforms to the transfected transcript of the HCV construct I 377 /NS3-37wt. 
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[0070] To analyze the viral proteins, the cells in question were first radioactively labeled 
metabolically with [ 35 S]methionine/cystein, then lysed, and then the HCV-specific 
proteins were isolated from the cell lysates by immunoprecipitation. The results of these 
analyses are shown in Fig. 3 A. In detail, the procedures was as follows: Cells of cell 
clones 9-13 (wt) and 8-1 ( ) had been radioactively labeled metabolically by treatment 
for 16 hours with a protein-labeling mixture (e.g. NEN Life Science) familiar to one 
skilled in the art and commercially available. The HCV-specific proteins had been 
separated out of the cell lysate by immunoprecipitation (IP) under non-denaturing 
conditions (for example according to Bartenschlager et al., 1995, Virol. 69, 7519) and 
using three different antisera (3/4, 5 A, 5B as marked at the top ends of Tracks 1 to 12). 
The immunocomplexes were analyzed by means of Tricine SDS-PAGE and visualized by 
autoradiography. To obtain authentic size markers, the homologous replicon construct 
I 3 77/NS3-37wt was subjected to transient expression with the Vaccinia Virus T7 hybrid 
system in Huh-7 cells. The products obtained had been treated as size markers (Tracks 7- 
9) in parallel with the cells of clones 9-13 and 8-1. Identified HCV proteins are labeled at 
the left edge of Track 1, and the molecular weights (in kilodaltons) are indicated at the 
right edge of Track 9. It should be noted that the NS3/4-specific antiserum ('3/4') used 
reacts preferentially with NS4A and NS4B, which leads to under-representation of NS3. 

[0071] All of the viral antigens were clearly detectable and their apparent molecular 
weights showed no difference from those that were determined after transient expression 
of the same bicistronic HCV RNA constructs in the original Huh-7 cells. To determine 
the subcellular distribution of the viral antigens, an immunofluorescence detection 
reaction was carried out using NS3- and NS5A-specific antisera (for example by the 
method of Bartenschlager et al., 1995 J. Virol. 69, 7519). To do this, cells of clones 9-13 
(wt) and 8-1 (A) were fixed with methanol/acetone for 24 hours after plating on cover 
glasses, and were incubated with polyclonal NS3- or NS5A- specific antisera. The bound 
antibodies were visualized with a commercially available FITC-conjugated anti-rabbit 
antiserum. To suppress nonspecific fluorescence signals, the cells were counter-stained 
with the dye 'Evans Blue'. 

[0072] The results of this detection test are shown in Fig. 3 B. Strong fluorescence was 
detected in the cytoplasm with both antisera. The NS5A-specific antisera also led to weak 
cell nucleus fluorescence, which indicates that at least small amounts of this antigen also 
reach the cell nucleus. The generally dominating presence of the viral antigens in the 
cytoplasm, however, is a strong indication that the HCV RNA replication takes place in 
the cytoplasm, just as is the case with most RNA viruses. 

[0073] These results demonstrate clearly that the experimental formulation described 
here succeeded in constructing a cell culture system for HCV whose efficiency exceeds 
everything known heretofore by orders of magnitude, and for the first time permits the 
detection of viral nucleic acids • and protems/by conven^ and proven biochemical 
methods. Only this efficiency permits any detailed stuoTes at all of HCV pathogenesis, 
genetic analyses of various HCV functions, and a precise study of virus/host cell 
interactions, by which new points of attack can be defined for the development of 
antiviral therapy. 
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Example 3 : Transfection of Huh-7 cells with HCV genome constructs 

[0074] Huh-7 cells are transfected and selected as described in Example 2, but in this 
case selectable constructs are used that contain the complete virus genome. The cell 
clones obtained are tested analogously to Example 2 by PCR for the absence of HCV 
DNA, and the productive replication of HCV RNA is then detected by Northern Blot, 
[ 3 H]uridine labeling in the presence of dactinomycin, and detection of viral proteins and 
antigens, preferably using Western Blot, immunoprecipitation, or immunofluorescence. 
In contrast to the formulations described in Example 2, the construct described here can 
also contain complete and very probably infectious viruses, which is not the case in the 
subgenome constructs described there (in Example 2). These viruses that are present in 
the cell and the cell culture supernatant are concentrated, for example by 
ultracentrifiigation, immunoprecipitation, or precipitation with polyethylene glycol, and 
all exogenous nucleic acids, i.e. those not incorporated in the virus particle, are digested 
by incubation with nucleases (RNase, DNase, micrococcus nuclease). In this way all 
contaminating nucleic acids that are not contained in the protecting virus particle can be 
removed. The protected viral RNA is isolated after inactivation of the nucleases, for 
example by incubation with proteinase K in a buffer containing SDS, by extraction with 
phenol and phenol/chloroform, and detected by Northern Blot or RT-PCR using HCV- 
specific primer. The combination of the described HCV consensus genome with a 
selection marker is also critical in the experimental formulation for the efficient 
production of viral RNA, viral protein, and with it HCV particles. 

Example 4 : Preparation and use of an HCV RNA construct in which the resistance 
gene is joined to the HCV subgenome sequence through a ribozyme or a recognition 
site for a ribozyme 

[0075] An HCV RNA construct is prepared according to Example 1 or Example 3, in 
which an antibiotic resistance gene is joined to the HCV RNA sequence through a 
ribozyme or a recognition site for a ribozyme. Such constructs are illustrated 
schematically in Fig. 7. Huh-7 cells are transfected with this HCV RNA construct as 
described in Example 2. After transfection into the cells, selection with the corresponding 
antibiotic is first carried out. The cloned-in ribozyme in the cell clones thus obtained is 
activated, or in the case of a construct that carries a recognition site for a ribozyme, the 
ribozyme is inserted into the cell (for example by transfection of a ribozyme construct or 
infection with a viral expression vector in which the corresponding ribozyme was used). 
In both cases the resistance gene is separated from the HCV RNA sequence by ribozyme- 
mediated cleavage. The result in the case of the HCV genome construct is an authentic 
HCV genome with no resistance gene, which is capable of forming authentic infectious 
virus particles. In the case of the HCV subgenome construct, an HCV replicon with no 
resistance gene is formed. , , : — ^ f 

Example 5 : Cotransfection of an HCV RNA construct with a separate luciferase 
transfection construct 
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[0076] An HCV RNA construct is prepared according to Example 1 (A) or Example 3 or 
Example 4. In parallel with this, a transfection construct is prepared that comprises the 
luciferase gene, with this luciferase gene being joined by means of a first nucleotide 
sequence that codes for an HCV protease cleavage site (e.g. NS3 protease cleavage site), 
to a second nucleotide sequence that codes for another protein or part of another protein. 
The HCV RNA construct and the transfection construct are inserted into any host cells, 
preferably hepatoma cells, especially Huh-7 cells. This can be done by the method 
described in Example 2. The product of the modified luciferase gene is a luciferase fusion 
gene in which the luciferase is inactive because of its fusion with the foreign part. In 
transfected cells with high HCV replication, the fusion protein, that does contain a cutting 
site for an HCV protease, is cleaved and thus the active form of luciferase is liberated, 
which can be determined by luminometric measurement. If the replication of the HCV 
RNA construct is inhibited, the fusion protein is not cleaved and no active luciferase is 
liberated. Consequently, the quantitative determination of luciferase is a measure of the 
replication of the HCV subgenome construct. A cellular protein that is inactivated or 
activated by the HCV proteins or nucleic acid can also be used as a so-called surrogate 
marker. In this case the expression or activity of this surrogate marker is a measure of the 
replication of the viral DNA. 

Example 6 : Preparation of HCV subgenome constructs with integrated foreign gene 
for use as liver-specific gene ferries for gene therapy 

[0077] These recombinant and selectable HCV subgenome constructs are transfected into 
trans-complementing helper cell lines, i.e. into cell lines that express the missing 
functions (for example the structural proteins) inducibly or structurally. Cell clones that 
contain a functional HCV subgenome construct can be established by appropriate 
selection. The virus structural proteins expressed by the host cells permit the formation of 
virus particles into which the RNA of the HCV subgenome construct is inserted. The 
result is therefore virus-like particles that contain an HCV subgenome construct including 
the cloned-in foreign gene and that can transfer this to other cells by infection. An 
example of such a construct is shown in Fig. 8. There is also the ability to use the HCV 
subgenome construct pursuant to the invention with integrated foreign gene described 
here, directly as an expression vector. In this case, the procedure is analogous to the 
method described above, but with the difference that cell lines that express no trans- 
complementing factors are transfected. In this case the HCV construct therefore serves 
only as an expression vector. 

Example 7 : Preparation of cell culture-adapted HCV RNA constructs 
(A) Isolation procedure 

[0078] The procedure for detenninihg adkptive mutatibns and for preparing cell culture- 
adapted HCV RNA constructs was as follows: Cells were transfected with an HCV RNA 
construct as described under Examples 1 and 2, and G418-resistant cell clones were 
prepared. To determine the replication competence (which means in this context the 
number of G418-resistant cell clones that are contained per microgram of transfected 
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HCV RNA or HCV RNA construct), by way of example, the total RNA was isolated 
from one of the cell clones called 9-13 (Fig. IB, Track 1 1), and the amount of HCV RNA 
contained in it was determined by Northern Blot as described in Fig. 2 B. 10 micrograms 
of the total RNA, which contained about 10 9 molecules of HCV RNA, was then inserted 
into natural Huh-7 cells by electroporation (Fig. 9). In parallel with this, 10 9 in vitro 
transcripts of the analogous neo-HCV RNA that had been made up to a total RNA 
amount of 10 ng with isolated total RNA from natural Huh-7 cells was transfected into 
natural Huh-7 cells. After selection with G418, the number of cell colonies, expressed as 
'colony- forming units (cfu) per microgram of RNA 1 in the two formulations was 
determined. With a concentration of 500 jig/ml of G418 in the selection medium, the 
number of colonies that were obtained with the HCV RNA contained in the isolated total 
RNA, amounted to about 100,000 cfu per microgram of HCV RNA. On the other hand, 
only 30-50 colonies were obtained with the same amount of in vitro transcribed HCV 
RNA. This result proves that the specific infectiousness of the HCV RNA that was 
isolated from the cell clones is about 1,000-10,000 as high as the infectiousness of the 
analogous in vitro transcripts. The procedural method is shown in Fig. 9. 

[0079] Using 'long-distance RT-PCR', the HCV RNA from the total RNA of the 9-13 
cells was amplified, the PCR amplificate was cloned, and numerous clones were 
sequenced. Comparison of the sequences of these recloned RNAs with the sequence of 
RNA that was originally inserted into the natural Huh-7 cells showed that the recloned 
RNAs had numerous amino acid replacements that were distributed over the entire HCV 
sequence (Fig. 10). Sfil fragments of these recloned mutants were inserted into the 
original replicon construct to replace its analogous Sfil fragment, and RNAs of the 
particular mutants were inserted into natural Huh-7 cells. After selection with G418, the 
number of colonies formed was then determined for each HCV RNA mutant. While only 
30-50 colonies per microgram of RNA were obtained with the initial RNA, the number of 
colonies from two of the recloned variants was distinctly higher (Fig. 10). In the case of 
the HCV RNA constructs 9-131 and 9-13C, the specific infectiousness was 100-1,000 cfu 
per microgram of RNA, and for the 9-13F replicon it was even 1,000-10,000 cfu per 
microgram of RNA. These results show that the amino acid replacements in the analyzed 
NS3-5B region of mutants 9-131, 9-13C, and especially 9-13F led to a clear increase of 
replication competence. On the other hand, none of the other HCV RNA constructs (9-13 
A, B, G, H, or K) were still replication competent, and therefore contained lethal 
mutations. 

[0080] To answer the question of which of the amino acid replacements in the 9-13F 
construct led to the increase in replication, the replacements were inserted individually or 
in combination into the initial HCV RNA construct, and the corresponding RNAs were 
inserted into natural Huh-7 cells. The result of transfection with these RNAs is 
summarized in Table 1 . It is apparent from this that the high replication competence in 
the present example is caused by multiple mutations: :The amino acid replacements in the 
HCV RNA sections NS5 A and NS4B make the largest contribution. The individual 
replacements in the NS3 region also make a contribution that may originate from 
synergism of these individual replacements. 
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These findings show that there was enrichment of HCV RNAs that had clearly higher 
replication competence from the G418 selection of the cells that were transfected with the 
weo-HCV RNA constructs. HCV RNA constructs with very diverse replication 
efficiencies can be selected with the experimental formulation described here. The higher 
the concentration of antibiotic in the selection medium in/on which the cells containing 
the HCV RNA construct are cultured for purposes of selection, the higher the degree of 
adaptive mutations has to be, and thus the higher the replication efficiency in the HCV 
RNA constructs in question has to be, for the cells to be able to grow. If the selections are 
carried out with low concentrations of antibiotic, cells can also survive and multiply that 
have fewer adaptive mutations and lower replication efficiency. 

The HCV RNA construct 9-13F described above, which contained multiple adaptive 
mutations, had demonstrated higher replication efficiency than the parental HCV RNA. 
To obtain HCV RNAs with still higher replication in cell culture, the HCV RNA that was 
contained in the total RNA of a chosen cell clone was passed repeatedly into Huh-7 cells. 
This chosen cell clone, called 5-15, was obtained by transfection with the RNA construct 
I 3 89/NS3-3' (Fig. 1). It corresponds largely to cell clone 9-13, which was prepared by 
transfection with an HCV RNA construct that had an HCV IRES shorter by 22 
nucleotides (I 3 77/NS3-3'; Fig. 1). 10 micrograms of total RNA isolated from the cell clone 
5-15 was inserted into natural Huh-7 cells by electroporation, and the cells were 
subjected to selection with 1 mg/ml of G418. From one of the cell clones produced in this 
way, total RNA was in turn isolated, transfected into natural Huh-7 cells, and selected 
analogously. This procedure was repeated a total of four times. After the fourth passage, 
the total RNA was isolated from one cell clone and the «eo-HCV RNA was amplified 
using 'long-distance RT-PCR'. The amplified DNA fragment was digested with the 
restriction enzyme Sfil and inserted into the Sfil-restricted initial construct I 38 9/NS3-3\ 
More than 100 DNA clones were obtained in all, and were first analyzed by restriction 
digestion. In vitro transcribed RNA from each of about 80 of these clones was inserted 
into natural Huh-7 and subjected to selection with 500 mg/ml of G41 8. Of the 80 
neo-HCV RNAs studied, almost all of them proved to be replication-defective. With two 
mutants, however, called 5.1 and 19, their specific infectiousness, expressed as 'colony- 
forming units' per milligram of RNA, was very clearly increased (Table 2). By multiple 
passage of the RNA in cell culture, HCV RNAs can apparently be prepared whose 
replication efficiency because of mutations (so-called "adaptive mutations") is higher by 
several orders of magnitude than that of the RNA originally cloned from the patient. 

(B) Modification procedure 

[0081] Such adaptive mutations produced and identified according to (A) can be 
transferred to an HCV RNA construct with low replication competence and lead to a 
massive increase of replication, of this construct. This increase is so great that it can be 
shown with them that HCV RNAs can be caused to replicate in cell culture that no longer 
have any selectable marker gene. Fig. 12 shows a comparison of the replication 
efficiency of HCV RNAs that correspond either to the initial sequence or to the adapted 
sequences 9-13F or 5.1. For the purpose of easier measurement, the rceo-gene was 
removed and replaced by the gene for luciferase. An HCV RNA construct that was 
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replication-defective because of an inactivating mutation of the NS5B RNA polymerase 
served as negative control. Even 24 hours after transfection, a distinct difference was 
found in luciferase activity between the defective RNA and the 9-1 3F or 5.1 constructs, 
while hardly any difference was found between the defective RNA (3 1 8 DN) and the 
initial RNA construct (wt) that had no adaptive mutations. The highest luciferase activity 
and with it the highest replication during the entire period of observation was obtained 
with the 5.1 RNA. These findings not only demonstrate the high replication efficiency of 
this RNA, but they also show that it is possible with adapted HCV RNA constructs to 
construct a cell culture system for which the presence of a selectable gene is no longer 
necessary. Table 3 gives a summary review of the nucleotide and amino acid differences 
between the initial construct and the mutants 9-1 3F, 5.1, and 19. 

Example 8 : Preparation of cell culture-adapted full-length HCV RNA genomes 

[0082] In Examples 1 to 7 a subgenomic HCV RNA was used that lacked the entire 
structural protein region from core up to and including p7 or NS2. In the present Example 
8, it will be shown that it is possible with the help of the adapted NS3-5B sequence to 
cause a full-length HCV genome to replicate in cell culture. For this purpose, the Sfil 
fragment of the highly adapted HCV RNA 5.1 prepared according to Example 7 was first 
transferred into a selectable full-length HCV genome (Fig. 12). This HCV genome was 
transfected into natural Huh-7 cells and subjected to selection with various G418 
concentrations. Depending on the strength of selection (the G418 concentration), 
different numbers of cell clones were obtained (Fig. 12 B). In comparison with this, no 
colonies were obtained with the unchanged full-length HCV genome that contained no 
adaptive mutations, as well as with the negative control that was replication-defective 
because of an inactivating mutation in the NS5B RNA polymerase. To demonstrate that 
the cell clones thus formed actually contained an autonomously replicating full-length 
HCV genome, total RNA from several clones was isolated and analyzed by Northern 
Blot. The full-length HCV was clearly detectable in all of the cell clones (Fig. 12). This 
proves unequivocally that it is possible by using the HCV sequences adapted to cell 
cultures to prepare a full-length HCV genome that replicates at high efficiency and 
autonomously in a cell line, in other words adapted full-length HCV genomes can also be 
prepared with the system pursuant to the invention. Since this clone furthermore has the 
complete HCV sequence, including the structural proteins necessary for the formation of 
virus particles, it is possible with this system to prepare large amounts of infectious virus 
particles in cell cultures. To detect these viruses, cell-free supernatants of cells that carry 
a replicating full-length HCV genome are added to natural Huh-7 cells, and the cells thus 
infected are subjected to selection with G41 8. Each cell clone that grows under these 
conditions is attributed to an infected cell. The viruses in the cell culture supernatants of 
cells that have a replicating full-length HCV genome, however, can also be concentrated 
and purified by various methods known in the state of the art such as ultracentrifugation 
or microdialysis, and can then be used to iitfect naturil-cells. This procedure shows 
clearly that cell culture-adapted full-length HCV genomes can be prepared with the HCV 
cell culture system pursuant to the invention that replicate in cells with high efficiency 
and that produce infectious viruses. These can likewise be detected by infection of an 
experimental animal, preferably chimpanzees. 
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Example 9 ; Preparation of full-length HCV constructs and HCV subgenome 
constructs with reporter gene. 

[0083] An HCV RNA construct is prepared in which a reporter gene is inserted instead of 
the antibiotic resistance gene (Fig. 13). Replication in this case can be determined by the 
amount or activity of the reporter gene or of the reporter gene product. The reporter gene 
is preferably a gene from the group comprising the luciferase gene, the CAT gene 
(chloramphenicol-acetyl transferase gene), the lacZ gene (beta-galactosidase gene), the 
GFP gene (green fluorescence protein gene), the GUS gene (glucuronidase gene), or the 
SEAP gene (secreted alkaline phosphatase gene). These reporter genes and their 
products, namely the corresponding reporter proteins, can be determined by fluorescence, 
chemiluminescence, colorimetrically, or using immunological methods (e.g. enzyme- 
linked immunosorbent assay, ELISA). The reporter gene can be expressed either by its 
own IRES or in the form of a fusion protein that is either active as such or is joined to an 
HCV protein by means of a proteolytically cleavable amino acid sequence in such a way 
that it is split off from it by a cellular or viral (HCV) protease. 

Example 10: Preparation of full-length HCV constructs with integrated foreign 
genes for use as liver-specific gene ferries for gene therapy or as expression vectors. 

[0084J The construct (Fig. 14) is inserted into cells and leads there to the formation of 
HCV virus particles that can be used for the infection of other cells. Since the virus 
particles have encapsulated an RNA with a foreign gene, it can be used in the cells thus 
infected to produce the protein encoded by this foreign gene. Cells that have been 
transfected with the construct likewise express the foreign gene. 

Example 11 : Preparation of monocistronic HCV RNA constructs in which the 
resistance gene product is expressed as a fusion protein with the HCV component 

[0085] For certain studies it is advantageous for the HCV RNA to have no heterologous 
IRES element. Examples of such studies are determinations of interferon resistance. If a 
cell that has an HCV RNA construct is incubated with alpha- or beta-interferon, there is a 
reduction of replication of the HCV RNA. To explain the mechanism of action it is 
necessary for the HCV RNA to have no heterologous IRES, since otherwise it cannot be 
determined whether the interferon-imparted inhibition is caused by inhibition of HCV 
replication or by inhibition of the heterologous IRES. For this reason, constructs are 
prepared in which the resistance gene is fused with an HCV protein (Fig. 15). Either the 
fusion protein is active as such, or the resistance gene product is joined to an HCV 
protein by means of a proteolytically cleavable amino acid sequence in such a way that it 
is split off from it by a cellular or viral (HCV) protease^ 
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Table 1 



Spezifische Infektiosit&ten (cfu/ug RNA) der HCV-RNA-Konstrukte mrt adaptrven Mutabo 
/ Mutante gefunden und in das parentale HCV-RNA-Konstrukt i^S^Mi emg 


nen, die bei der 9-1 3F 
efuhrt wurden 


Aminosaureaustausch 1 2^ 


HCV-Protein 


cfu/^ig RNA 2 


kein 3 






1283arg -> gly 


NS3 


200 - 250 


1383 glu -> ala 


NS3 


30-60 


1577 lys-> arg 


NS3 


30-60 


1609 lys -> glu 


NS3 


160 - 300 


(1283 arg -> gly + 1383 glu -> ala+ 1577 lys -> arg + 1609 lys - 
>glu) 


NS3 


360 - 420 


1936 pro -> ser 


NS4B 


500- 1000 


2163 glu -> gly 


NS5A 


1000-500.0 


2330 lys -> glu 


NS5A 


30-60 


2442 ile -> val 


NS5B 


30-60 


alle zusammen <f 




5000 



1 Amino acid replacement in the polyprotein of the HCV isolate Con-1 (EMBL gene bank 
No. AJ238799); the amino acids are given in three-letter codes. 

2 Colony-forming units (number of cell clones) in a selection from 500 ^g/ml G418. 

1) Specific infectiousness (cfu/jig RNA) of the HCV RNA constructs with adaptive 
mutations that were found in the 9-13F mutants and were inserted into the 
parental HCV RNA construct I 3W /NS3-3Vwt 

2) Amino acid replacement 1 

3) None 

4) all together 
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Table 2 



Spezifische Infektiositaten (cfu/*ig RNA) des parenta- ; 
!en HCV-RNA-Konstrukts Ij^jc/NSS-S'/wt und der Van- ; 
/ anten 9-13C, 9-131, 9-13F, 5.1 und 19. 


Transfizierte RNA-Vari- 
ante 2- 


cfu/jAg RNA 1 


j Wildtyp 


30-50 


9-13 C 


100-1.000 } 


9-131 


100-1.000 


9-13 F 


1.000-10.000 


5.1 


50.000- 100.000 


19 


50.000- 100.000 



1 Colony-forming units (number of cell clones) in a selection from 500 ug/ml G418. 

1 ) Specific infectiousness (cfu/ug RNA) of the parental HCV RNA construct 
l3 89 /NS3-37wt and of the variants 9-13C, 9-131, 9-13F, 5.1, and 19. 

2) Transfected RNA variant 

3) Wild type 
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Table 3: Nucleotide and amino acid differences between the parental HCV RNA 
construct I 38 9/NS3-3Vwt and the mutants 9-131, 9-13F, 5.1, and 19 



HCV Mutante 

/ 


Nukleotidposition 

Z 


Nokleotidauxtaosch 

3 


Aminosaareaastausc 

k ¥ ; 


9-131 


3685 


C>T 


Pro>Leu | 




4933 


C>T 


Thr > Met | 




5249 


T>C 


- 




8486 


C>T 


- 




8821 


G> A 


Trp > stop 




8991 


C>G 


Arg>CHy 




9203 


A>G 


- 




9313 


T>C 


Phe > Ser 




9346 


T>C 


Val> Ala 


9-13 F 


3866 


C>T 


- 




4188 


A>G 


Arg > Gly 




4489 


A>C 


Glu > Ala 




4562 


G> A 


- 




4983 


T>C 


- 




5071 


A>G 


Lys > Arg 




5166 


A>G 


Lys > Glu 




6147 


C>T 


Pro > Ser 




6829 


A> G 


Glu > Gly 




7329 


A>G 


Lys > Glu 




7664 


A>G 


Ile>Val 




8486 


C>T 




I 


8991 


C>G 


Arg > Gly 


NK5.1 


4180 


C>T 


Thr > lie 


i 


4679 


C>T 


i 

i 



1) HCV mutant I; . L ?$(f 

2) Nucleotide position 

3) Nucleotide replacement 

4) Amino acid 
replacement 
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4682 


T>C 






5610 


C> A 


Leu > Be 




6437 


A>G 


• 




6666 


A> G 


Asn> Asp 




6842 


C>T 


- 




6926 


C>T 


• 




6930 


T>C 


Ser>Pro 




7320 


C>T 


Pro > Ser 




7389 


A> G 


Lys>Ghi 


NK19 


3946 


A> G 


Glu>Gly 




4078 


OG 


Ala>Gfy 




4180 


C>T 


Thr>IIe 




4682 


T>C 


- 




5610 


C>A 


Leu > He 




5958 


A>T 


Met>Leu 


! 


6170 


T> A 


- 


! 
t 


6596 


G> A 


- 




6598 


C>G 


Ala>Gly 




6833 


C>T 


• 


i 


6842 


C>T 


— 






T > C 


Ser > Pro 




7141 


A> G 


Glu>Gly . 


1 


7320 


C>T 


Pro > Ser 


1 


7389 


A>G 


Lys>G!u 




7735 


G> A 


Ser > Asn 



[0086] The differences in nucleotide and amino acid sequences between the initial HCV 
RNA sequence Con 1 (EMBL gene bank No. AJ238799) and those of the cell 
culture-adapted HCV RNAs are indicated. The numbers refer to the nucleotide and amino 
acid positions of the HCV isolate Con 1. 
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Patent Claims 

1. Hepatitis C virus (HCV) cell culture system that comprises essentially eucaryotic cells 
that contain inserted HCV-specific genetic material, characterized by the fact that 

the eucaryotic cells are human hepatoma cells and that the inserted HCV-specific 
genetic material is an HCV RNA construct that comprises the HCV-specific RNA 
sections 5' NTR, NS3, NS4A, NS4B, NS5A, NS5B, and 3' NTR, and additionally 
a selectable marker gene (selection gene). 

2. Cell culture system pursuant to Claim 1, characterized by the fact that 

the hepatoma cells originate from a commercial hepatoma cell line. 

3. Cell culture system pursuant to Claim 1 , characterized by the fact that 

the hepatoma cells are obtained from a hepatoma primary cell culture. 

4. HCV RNA construct, characterized by the fact that 

it comprises the HCV-specific RNA sections 5' NTR, NS3, NS4A, NS4B, NS5A, 
NS5B, and 3' NTR, and additionally a selectable marker gene (selection gene). 

5. HCV RNA construct pursuant to Claim 4, characterized by the fact that 

it comprises a nucleotide sequence according to the sequence protocols SEQ ID 
NO: 1 to SEQ ID NO: 11. 

6. HCV RNA construct pursuant to Claim 4, characterized by the fact that 

the 3* NTR has a nucleotide sequence that is selected from the group of nucleotide 
sequences (a) to (i) listed below: 



TTGCCCAGACTGGAGT 



THIS PAGE BLANK <ysra» 



EP 1 043 399 A2 



(b) ACGGGGAGCTAAACACTCCAGGCCAATAGGCCATCCTGTTTTTT 
TTTTT AGTCT TTTTTTTTTC TTTTTTTTGA GAGAGAGAGT 
CTCACTCTGT TGCCCAGACT GGAGC 

(c) ACGGGGAGCTAAACACrCCAGGCCAATAGGCCATCCTGTTTTTT 
TTTAATCTTT TTTTTTTTCT TTTTTTTTGA GAGAGAGAGT 
CTCACTCTGT TGCCCAGACT GCAGC 

(d) ACGGGGAGCTAAACACTCCAGGCCAATAGGCCATCCTGTTTTTT 
TTTTTTAGTC TTTTTTTTTT TC 11 111 1 n TGAGAGAGAG 
AGTCTCACTC TGTTGCCCAG ACTGGAGT 

(e) ACGGGGAGCTAAACACTCCAGGC CAATAG GCCATCCTGTTTTTT 
TTTTTAGTCT TTTTTTTTTT TCTTTTTTTT TGAGAGAGAG 
AGTCTCACTC TGTTGCCCAG ACTGGAGT 

(f) ACGGGGAGCTAAACACTCCAGGCCAATAGGCCATCCTGTTTTTT 
TTTTTAGTCT TTTTTTTTTT TCTTTTTTTT TTGAGAGAGA 
GAGTCTCACT CTGTTGCCCA GACTGGAGT 

(g) ACGGGGAGCTAAACACTCCAGGCCAATAGGCCATCCTGTTTTTT 
TTTTTAGTCT TTTTTTTTTT C IT 1 1 1 1111 GAGAG AGAG A 
GTCTCACTCT GTTGCCCAGA CTGGAGT 

(h) ACGGGGAGCTAAACACTCCAGGCCAATAGGCCATCCTGTTTTTT 
TTTTTTTAAT CTTTTTTTTT TTTTTCCTTT TTTTGAGAGA 
GAGAGTCTCA CTCTGTTGCC CAGACTGGAG T 

0) ACGGGGAGCTAAACACTCCAGGCCAATAGGCCATCCTGTTTTTT 
TTTTTTAATC 1111111111 TTTTCTTTTT TTTTTGAGAG 
AGAGAGTCTC ACTCTGTTGC CCAGACTGGA GT 

7. HCV RNA construct pursuant to one of the claims 4 to 6, characterized by the fact that 

the selectable marker gene is a resistance gene and especially an antibiotic 
resistance gene. 

8. HCV RNA construct pursuant to one of the claims 4 to 6, characterized by the fact that 

the selectable marker gene is;a neomycin phosphotransferase gene. 

9. HCV RNA construct pursuant to one of the claims 4 to 8, characterized by the fact that 

the selectable marker gene is integrated into the HCV RNA downstream from the 
5'NTR. 
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10. HCV RNA construct pursuant to one of the claims 4 to 9, characterized by the fact 
that 

the selectable marker gene is joined to the HCV RNA through a ribozyme or a 
recognition site for a ribozyme. 

1 1 . HCV RNA construct pursuant to one of the claims 4 to 1 0, characterized by the fact 
that 

it has an integrated reporter gene. 

12. HCV RNA construct pursuant to claim 1 1 , characterized by the fact that 

the reporter gene is a gene from the group consisting of the luciferase gene, the 
CAT gene (chloramphenicol acetyltransferase gene), the lacZ gene (beta- 
galactosidase gene), the GFP gene (green fluorescence gene), the GUS gene 
(glucuronidase gene), and the SEAP gene (secreted alkaline phosphatase gene). 

1 3. HCV RNA construct pursuant to one of the claims 4 to 1 1 , characterized by the fact 
that 

its replication affects the expression of a (cellular) surrogate marker gene. 

14. HCV RNA construct pursuant to one of the claims 1 1 to 13, characterized by the fact 
that 

the resistance gene is cloned into the open reading frame of the HCV RNA in 
such a way that it is convertible to an active form only after proteolytic 
processing. 

15. HCV RNA construct pursuant to one of the claims 1 1 to 14, characterized by the fact 
that 

the reporter gene and the selectable marker gene are arranged spatially in the 
construct in such a way that they jointly express a fusion protein. 

16. Cell culture system pursuant to one of the claims 1 to 3, characterized by the fact that 

the HCV RNA construct is a construct according to at least one of the claims 4 to 



17. Cell culture system pursuant to Claim 1, characterized by the fact that 

the cells containing the HCV RNA construct are deposited with the DSMZ, 
Braunschweig, FRG, under the archive number DSM ACC 2394 (laboratory 
designation HuBl 9-13). 



15. 



'to*-: 
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18. Use of a cell culture system pursuant to one of the claims 1 to 3 or 16 to 17 and/or of 
an HCV RNA construct pursuant to one of the claims 4 to 1 5 for the preparation and/or 
evaluation and/or testing of therapeutic agents and/or diagnostic agents for the treatment 
in particular of HCV infections. 

19. Use of a cell culture system pursuant to one of the claims 1 to 3 or 16 to 17 and/or of 
an HCV RNA construct pursuant to one of the claims 4 to 15 for the preparation of a 
vaccine against HCV infections. 

20. Use of an HCV RNA construct pursuant to one of the claims 4 to 15 for the 
preparation of a liver cell-specific gene ferry for gene therapy. 

21. HCV RNA construct pursuant to one of the claims 4 to 15, characterized by the fact 
that 

it has an integrated foreign gene and is suitable for inserting this foreign gene into 
a target cell that is suitable for the expression of this foreign gene. 

22. Method for obtaining cell culture-adapted mutants of an HCV RNA construct 
pursuant to one of the claims 4 to 15, with the mutants having higher replication 
efficiency than the HCV RNA construct, characterized by the fact that 

a cell culture system pursuant to Claim 1 in which the inserted HCV-specific 
genetic material is an HCV RNA construct with selection gene according to one 
of the claims 4 to 15, is cultured on/in the selection medium corresponding to the 
selection gene, the grown cell clone is harvested, and the HCV RNA constructs or 
parts thereof are isolated from these cell clones. 

23. Method pursuant to Claim 22, characterized by the fact that 

the isolated HCV RNA constructs are again passed at least once, namely inserted 
into cells of a cell culture system pursuant to Claim 1, the cell culture system 
pursuant to Claim 1 in which the inserted HCV-specific genetic material is the 
isolated HCV RNA construct with selection gene is then cultured on/in the 
selection medium corresponding to the selection gene, the grown cell clone is 
harvested, and the HCV RNA constructs are isolated from these cell clones. 

24. Method for preparing mutants of a full-length HCV genome or of a partial HCV 
genome or of any HCV construct with higher replication efficiency than the original full- 
length HCV genome or partial genome or HCV RNA construct, characterized by the fact 
that ; ' {; 'Xv ;/< > %}SJT 

a cell culture-adapted mutant of an HCV RNA construct is prepared and isolated 
by a method pursuant to Claim 22 or 23, 
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the nucleotide and amino acid sequences of these mutants are determined and the 
type, number, and positions of the nucleotide and amino acid mutations are 
determined by comparison with the nucleotide and amino acid sequence of the 
original HCV RNA construct, 

and these mutations are introduced into an (isolated) full-length HCV genome or a 
partial HCV genome or any HCV RNA construct either by selective mutagenesis 
or by replacement of sequence sections that contain the mutations in question. 

25. Cell culture-adapted HCV RNA construct with high replication efficiency, 
characterized by the fact that 

it is derivable by nucleotide and/or amino acid mutations of an HCV RNA 
construct pursuant to one of the claims 4 to 15 and it is obtainable by a method 
pursuant to one of the claims 22 to 24. 

26. Cell culture-adapted HCV RNA construct pursuant to Claim 25, characterized by the 
fact that 

it has one or more of the amino acid replacements listed below, namely 1283 arg - 
> gly and/or 1383 glu -> ala and/or 1577 lys -> arg and/or 1609 lys -> glu and/or 
1936 pro -> ser and/or 2163 glu -> gly and/or 2330 lys -> glu and/or 2442 ile -> 
val. 

27. Cell culture-adapted HCV RNA construct pursuant to Claim 25 or 26, characterized 
by the fact that 

it has one or more of the nucleotide and/or amino acid replacements listed in 
Table 3, with Table 3 being part of this Claim. 

28. Cell culture-adapted mutants of an HCV RNA construct or of a full-length HCV 
genome with higher replication efficiency than the original HCV RNA construct or than 
the original full-length HCV genome, characterized by the fact that 

it is available by a method in which the type and number of mutations are 
determined in a cell culture-adapted HCV RNA construct pursuant to Claim 24 by 
sequence analysis and sequence comparison, and these mutations are introduced 
into an HCV RNA construct, particularly into an HCV RNA construct according 
to one of the claims 4 to 15, or into an (isolated) full-length HCV RNA genome, 
either by selective mutagenesis or by replacement of sequence sections that 
contain the mutations in question. 



29. Hepatitis C virus particle or virus-like particle characterized by the fact that 
it is obtainable by a method pursuant to one of the claims 22-24. 



30. Cells infected with hepatitis C virus particles or virus-like particles pursuant to Claim 
29. 
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[KEY TO FIGURES 5-8:] 

FIGURE 5: 

1) Resistance gene 

FIGURE 6: 

1) Reporter gene 

FIGURE 7: 

1) Ribozyme 

2) (Recognition sequence) 
FIGURE 8: 

3) Therapeutic foreign gene 
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[KEY TO FIGURE 9]: 

1) In vitro transcript of cloned HCV RNA 

2) G418-resistant colonies 

3) Preparation of total cell RNA from individual colonies 

4) Determination of number of molecules (OD 260 nm) 

5) Total RNA from natural Huh-7 cells 

6) Determination of the number of HCV RNA molecules (Northern Blot) 

7) Total cell RNA with known number of HCV RNA molecules 
+ CMV luciferase plasmid (transfection control) 

8) Natural Huh-7 cells 

9) • Electroporation 

10) -Plating out 

11) »G4 18 selection 

12) Cell colonies after about 3 weeks 
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/ In vitro Transkript von klonierter HCV-RNA 
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[KEY TO FIGURE 11]: 

1) • Linearization of plasmid 

2) • in vitro transcription 

3) • removal of matrix DNA 

4) Wild type HCV RNA construct 

5) Defective HCV RNA construct 

6) • Electroporation into natural Huh-7 

7) • Cell plating 

8) • Cell harvests at regular intervals 

9) • Determination of luciferase activity 

10) Luciferase activity (RLU x 10 4 ) 

1 1) Time after transfection (hours) 
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[KEY TO FIGURE 12]: 

1) 5.1 or 9-13F mutants 

2) G418 concentration 

3) Number of colonies obtained: 

4) Control 

5) Negative control 
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[KEY TO FIGURES 13-14]: 

FIGURE 13: 

1) Reporter genes 

FIGURE 14: 

2) Resistance genes 
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